其目标是战简化环节词

功能虽好,但也不必然产物内所有搜刮功能都需要加上拼音转文字能力,这个也是需要连系当前搜刮场景和用户行为具体阐发能否为一个高ROI功能。

输入拼音时可为文字进行成果查询,如:输入“chanpinsheji”,将为“产物设想”进行搜刮。就从小我日常利用搜刮功能而言,常会健忘切换输入法间接输入了拼音,此时供给该能力也能进行无效搜刮时是能带来体验上的欣喜感。

该能力合用于带有字母的成果数据。举个例子,正在ERP系统中有大量的企业物资消息,此中对于一些固定资产凡是会以“楼层+设备名+设备编号”来进行定名,如:“F6-iMac-7842”,字段为大小写字母混排,存正在较高的输入成本。若供给大小写转换,则间接输入“f6-imac-7842”也能呈现对应成果。

预处置指将环节词进行字符、删除、截断处置便利后续进行阐发。其目标是和简化环节词,更好的理解用户企图,以供给更合适的搜刮成果。

无意义字符包罗特殊符号(emjio、脸色符号、持续的空格符等)和无意义字符(“的”、“了”、“么”、“哈”等语气组词)。无意义字符会打包成一个《停用词库》做为搜刮设置装备摆设库存正在,且目前有大量的开源《停用词库》可间接挪用,所以具体停用哪些字符可基于开源词库的内容再连系营业进行增删。

留意看输入框下方第一行文字“正在高级搜刮中查看 ‘会 议’”,将“会 议+6空格”缩短成“会 议+1空格”,仅保留了一个空格做为分词符,去掉了多余的空格符。

如:正在一些B端 CRM系统中客服人员会通过搜刮客户名称进行材料录入,此时的搜刮场景大多是正在IM聊天窗口中复制客户名称再粘贴到搜刮框中从而完成搜刮行为。此时拼音转文字能力感化也不大。此时的搜刮大多不会牵扯到手动输入,

您可能还喜欢这些内容