澜科中文智能分词系统综合了新词语识别、词语领域聚类、歧异消解等等方面研究成果,并由各专业专家整理基本词汇、专业词汇和常用短语等资源,精心开发而成。
基本特点:
◆ 可选基本词表(8万)切分和固定短语词语表(35万)的切分。
◆ 结合多种统计方法高效、智能消歧。
◆ 精准全面的未登录词识别。快速识别人名、地名、机构名。
◆ 出色的命名实体识别功能,特别是对领域术语识别率比较高。
◆ 多粒度切分结果,根据不同应用提供从词到短语的多种切分结果。
◆ 提供15大类、244小类专业词典,用户可根据实际需求灵活加载。
◆ 提供用户词典接口,用户可以灵活得加载自己的词典。
◆ 提供用户外挂分词规范,用户可以自己定义分词规则。
应用范围:
◆ 信息检索:如全文检索、主题检索。
◆ 汉字处理:智能拼音输入、OCR识别、自动校对、简繁转换。
◆ 语音处理:如语音合成、语音识别。
◆ 内容标引:信息摘录、文摘、主题词标引、文本分类、自动过滤。
◆ 自然语言理解:如机器翻译、自然语言接口。
超链接至:自动分词演示
|