词汇表
术语 | 定义 |
---|---|
分类器 | 经过训练以识别和分类集合中的文档类型的资源。 另请参阅 文本分类器 和 文档分类器。 了解更多信息 |
文档分类器 | 一种分类器,用于根据从主体文本字段中抽取的单词和短语对文档进行分类,其中包含应用于所考虑主体文本的扩充项中的信息。 |
数据源 | 数据本身的来源(例如数据库或 XML 文件)以及访问数据所需的连接信息。 了解更多信息。 |
特定于领域 | 与对行业或企业具有特殊含义的术语和概念相关。 例如,在网球中,术语 爱 具有特殊含义。 |
扩充 | 通过向文档添加相关上下文来增强数据。 例如,将提及城市名称或名人的术语标记为感兴趣的位置或人员。 |
分面 | 用于过滤搜索结果的类别。 了解更多 |
正则表达式 | 一组字符、元字符和运算符,它们以搜索模式定义一个或一组字符串。 了解更多信息。 |
停用词 | 搜索应用程序忽略的常用词,例如 the ,an 或 and 。 了解更多信息。 |
文本分类器 | 一种分类器,用于根据从正文文本中抽取的单词和短语对文档进行分类。 |