|
“行业知识”+“深度搜索”,有效提高行业门户的竞争力。
◆ 定向挖掘行业知识
◆ 构建行业门户网站
◆ 生成行业分析报告
行业知识门户:针对某一个行业,满足行业专业需求的专业知识性网站,是综合新闻网站的细分和延伸,是对某类网页资源和结构化资源的深度整合,为用户提供专业信息服务。如“钢铁网”、“数码网”等。
爆炸式增长的信息资源缺乏内容的结构化,大大降低了人们利用信息的效率。大部分结构化信息提取都依靠手工完成,面对互联网的海量信息,很难保证信息的实时性和有效性。因此智能化成为行业知识门户和垂直搜索引擎的发展趋势。
基本特点:
◆ 定向数据采集:支持用户自定义范围的信息采集,如采集“钢铁”或“中厚板”主题内的网页。
◆ 数据结构化:利用网页结构分析方法,剔除垃圾信息,抽取特定的结构化信息数据,如标题、作者、发表时间、来源、正文等等。
◆ 内容中结构化实体信息的提取,包括人名、地名、组织机构名、电话号码等等。
◆ 智能内容分析:自动分类、自动聚类、自动标引(自动抽取关键词、摘要)、自动排重、褒贬倾向分析等。将内容以精练准确的类目、主题词和摘要表示出来,方便用户快速把握文献内容,提高浏览和检索的效率。
◆ 全文检索和精确检索,按需提供多种结果排序方式,如按内容相关度排序或按时间、来源排序,支持结构化和非结构化数据联合检索,如结合作者、主题词、类目进行组合检索等。
超链接至:文本分类
超链接至:关键词标引
超链接至:自动文摘
|
|