能把“半月传”自动识别为“芈月传”,“三角兽”想让 NLP 技术更赚钱

[每篇 3 分钟,钛媒体带你读懂人工智能

用一句简单的话概括NLP技术,即为:帮助机器听懂人话,并给人以回应。

在国内,围绕该领域延伸业务的巨头有微软小冰和百度度秘,随着技术发展与商用场景成熟,越来越多的创业公司开始投身于 NLP 技术的商业落地。

“在这个行业形成壁垒,主要看四个指标:团队、技术、头部客户、数据。”三角兽创始人兼 COO 马宇驰告诉钛媒体。5月15日,三角兽宣布完成B轮1.1亿人民币融资,本轮投资人包括富士康、汉富资本、中民投和光聚科创(厦门火炬高新科创)。

由于团队的大公司背景——CEO 王卓然为前百度度秘中控决策负责人、CTO亓超为微软小冰、百度度秘聊天技术负责人,三角兽尤其注重 AI 技术的商业化。从技术框架来看,三角兽的技术核心为“开放域聊天”与“任务驱动的多轮对话”。

“三角兽”创始团队:由左至右为

 “三角兽”创始团队:由左至右为CTO亓超、COO马宇驰、CEO 王卓然

表面来看,这两项功能解决的都是“人与机器对话”。不同的是,开放域聊天不限定话题,追求的是机器有能力聊得越多越好;多轮对话目的为解决问题,诉求是用最短的对话轮数完成任务。

目前,多轮对话有着更为明显的商业化诉求,比如与三角兽合作的小米电视,用户即使说出“半月传”、“邓超和他老婆演得电影”,系统也可以准确识别为《芈月传》、《恶棍天使》。

这种模糊语义识别能力体现了另一块技术壁垒。根据马宇驰透露,不少传统 NLP 公司用关键字、打标签和构建知识库的方式做,但三角兽更注重让底层语义系统经过真实对话训练后具备自主学习和拓展能力。

举个例子,要想让机器将“半月传”识别为“芈月传”,传统做法是由专门的标注师,在系统中为“半月传”单独加上标签。但三角兽的做法是,先抓取全网(比如豆瓣、时光网等影视论坛)的公开对话信息,一旦有人将“芈月传”错写成“半月传”,机器就会增加这两个词的相关性,就算用户输错信息,机器也能通过这种共性错误判断出真实目的。

除硬件智能语音交互场景,这种多轮对话还被应用在针对运营商、金融集团等客户的智能客服领域,目前三角兽的合作企业已包括中国移动、广发证券、天弘基金、恒生电子、OPPO、VIVO、小米等头部客户。

在不易标准化的“闲聊”式的开放域聊天方面,NLP 技术的应用场景,一是以儿童用户为主的智能硬件,其对于“聊天”安全性要求极高;二是电视音箱车载等智能硬件交互中,“闲聊”占比超过60%。此外,“闲聊”也能帮助技术后台采集用户信息、实现更精准为用户画像。

马宇驰透露,目前三角兽在“开放域聊天”方面的相关性早已超过90%,儿童聊天不良率小于0.006%。(本文首发钛媒体,作者/苏建勋)

Be the first to comment

Leave a Reply

Your email address will not be published.


*