自然语言处理NLP开发有哪些值得关注的开源工具?

智能语音助理、聊天机器人是时下人工智能的热点和突破口,但是并非每家公司都具备谷歌、Facebook、亚马逊、苹果等公司的经济?#22270;?#26415;实力来开发NLP应用,尤其是难度最大的会话型NLP应用。

所幸,目前NLP的开源技术已经足够强大,您可以轻松地“在巨人的肩膀上”,只需一个小型的专业团队,借助合适的平台方法就能开发出令人惊叹的,行之有效的NLP应用程序。

下表概述了当下一些值得研究的开源工具:

其次,即使有如此丰盛的精品技术资源触手可及,开发一个前端NLP(一个“会话”,这是大多数人在想到人工智能时所想到的)仍然需要?#37117;图?#25345;。因为在您看到一些高级功能的回报之前,它往往需要大量的前期投资。

后端NLP更容易,并提供更直接的投资回报率

基于NLP的业务改进不一定需要具有会话前端。后端驱动或语言分析项目通常是在短期内使用NLP见效最快,成本效益最好,最高回报的方式。此类项目的开发往往只需要两到三人的团队,在几个月内完成。

Cloudera机器学习总经理Hilary Mason在最近的Strata会议的主题演讲中展示了后端NLP的一个很好的例子。Mason解释了Cloudera如何使用NLP降?#25512;?#21628;叫?#34892;?#25104;本并提高?#31361;?#28385;意度。他们从呼叫?#34892;?#37319;集了记录呼叫的统计样本,并将其转录为文本。他们对该语料库进行了文本分析,寻求与特定问题和问题解决步骤相关的语音模式。然后,他们将基于此分析结果的预测模型部署到其呼叫?#34892;南低持小?#24403;?#31361;?#25171;电话时,基础算法识别出语音模式,并在?#31361;?#19982;?#31361;?#20132;谈时主动向?#31361;?#26381;务代表推荐可能的解决方案。

会话型NLP成本更高,需要战略情怀和长线?#24230;?/h3>

如果你致力于会话式NLP(或AI),希望机器与人类的交互能够达到人类之间?#21738;?#31181;流畅和模糊性,这在技术上具有极大的挑?#21483;裕?#25104;本也很高。我们不是在聊聊天机器人,聊天机器人其实是一个非常简单的程序,可以跟踪特定任务的相对结?#22815;?#30340;对话,并处于某些预定义的环?#24120;?#22914;Facebook Messenger。而会话AI是完全不同的,与Alexa类似,它们无处不在(它们随处可见),可以处理多个应用程序(也称为意图),并且可以处理各种响应。他们还可以迅速切?#24576;?#26223; – ?#28909;?#20174;提供有关今天天气的信息到预订餐厅。

目前已经存在多个开源平台(上图),允许您的团队在合理的时间范围内构建功能性(可能算不上完善)的AI,并且成本可以提供正回报。像苹果,谷歌,微软和亚马逊这样的公司每年都?#24230;?#20102;数亿美元,并将地球上一些最聪明的博?#23458;度?#21040;先进的NLP接口?#23567;?#32780;这些开源库使普通公司和团队也能凭借3-4人的团队,用大约一年时间开发出简单会话AI的基础平台,总计?#24230;?#32422;为500,000美元。这些早期平台具有一些简单的场景对话能力,但不会预先分析用户(这需要具备安全?#20302;?#30340;接口),并且没有先前用户会话的记忆。?#28304;?#24179;台为起点,每开发一个新的,简单的场景对话的成本约1万美元。

企业应当将会话型NLP的基础平台作为一种长线投资,每一个?#30053;?#30340;会话功能都会摊薄整体平台的成本。例如,允许人们?#36828;?#22833;/遗忘的密码或其他简单的IT问题进行自助服务可以节省每年至少一个IT运维人员的成本。通过在Excel中使用IRR功能的一些快速计算,并假设该角色每年花费100,000美元,快速计算该?#26696;?#26434;”应用程序的单年ROI约为260%,这显然值得做。成本只是我们用于确定会话功能开发优先级的一个因素,对于一些重要战略意义的会话功能,有时我们甚至应当在没有明确的,或极高的投资回报率的情况下进?#22411;?#36164;。

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章
河北20选5平台