针对于口语表达的单一化,我们开发了Smart Speech,希望以此来丰富人们在口语中的表达。
我们最初的构想是,可以通过一个固定在用户的办公桌上的接收器实时采集人们的日常交流。通过将这些交流的内容转化为文字,Smart Speech就可以得到人们每天的口语内容。基于此,我们可以分析出用户的情绪表达情况和口头禅的使用情况。
我们的出发点基于此:在过去,无论是近代的顾维钧、周恩来、李鸿章,还是古代的诸葛亮、苏秦,都能凭借着自己的语言艺术说服别人,以此来达成个人情怀和家国抱负。而到了如今,随着网络文化的入侵和生活节奏的加快,人们的语言表达正变得越来越单一——”玛德智障“、”蓝瘦香菇“、”呵呵“、”你开心就好“,”当然是选择原谅他啦“这样的无意义单调热词充斥口语,而真正的语言艺术正被忽略。
在构思这套系统时,我们包括了五大部分:1. 语音识别系统 2. 情感分析系统 3. 词频统计系统 4. 同义替换系统 和 5. 优秀词语推荐系统
- 语音识别系统
我们采用了百度AI开放平台的语音识别系统,以此来将音频信息转换为文字。
- 情感分析系统
我们继续采用了百度的AI开放平台,并且加入了一些自己的算法设计,可以准确的评估出用户语言的情感表达——在我们的理解中,鲜明的表达自己的观点正是在如今用语匮乏的社会下所需要的。
- 词频统计系统
我们采用了目前国内最优秀的中文分词应用之一的结巴分词,使用TF-IDF算法来对于在语音识别系统中得到的文本进行分词操作,分析出其中最具有代表性的词语。在我们的理解中——这些词语组成了一个人一天的说话中最主要的部分。
- 同义替换系统
在词频统计系统的基础上,我们使用了同义替换系统。同义替换系统由一个独立训练的非监督学习的中文词向量集组成,我们对于每个在词频系统中得到的最具风格的词语在词向量集中通过余弦相似性(Cosine Similarity)寻找最相关的词语,以便用户对风格化的词语进行同义替换。
- 优秀词语推荐系统
在前面四大系统之外,我们还有优秀词语的推荐系统,每天向用户推送一些在生活中不太常用、但是非常具有表现力的词语。在具体的实现方面,我们遇到了很多的问题。比如说,由于OrangePi的驱动和麦克风模块的不兼容,导致我们一直无法实时捕捉用户的数据;由于Google CloudPlatform的SDK模块难以完整下载,我们不得不转而采用百度的SDK;同样的,我们在百度的RESTful API的参数传递上也遇到了不小的挑战,甚至还有来自服务器https根证书的难题(值得一提的是,由于一些技术限制,我们的五个平台分布在三台不同的主机上)。但幸运的是,我们最终还是完成了这个项目。
By Smart Speech团队
分工:
张轶泓:自然语言处理、文案
吴郁非:前端、开发板
张博越:后端、服务器、SDK的调用、开发板
夏帅凡:平面设计、文案
Log in or sign up for Devpost to join the conversation.