大数据处理
首页  >  大数据处理

文本挖掘

发布时间:2022-04-09 00:53:18

从大量非结构化的文本中寻找知识。文本挖掘主要领域有:

信息检索:存储和文本文档的检索,包括搜索引擎和关键字搜索。

文本聚类:使用聚类方法,对词汇,片段,段落或者文件进行分组和归类。

文本分类:对片段,段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过训练地标记示例模型。

Web挖掘:在互联网上进行数据和文本的挖掘,并特别关注网络的规模和相互联系。

信息抽取:识别与提取有关的事实和关系。

概念提取:把单词和短语按语义分成意义相似的组


Copyright ©2014-2022 北京珀百技术服务有限公司 京ICP备14034105号 版权所有