利博四字成语大全(集团官网)
金融界2024年10月18日消息,国家知识产权局信息显示,北京尚石科技有限公司申请一项名为“一种基于文本向量化的文本分类系统”的专利,公开号 CN 118779454 A,申请日期为 2024 年 7 月。
专利摘要显示,本发明涉及文本主题分类技术领域,尤其涉及一种基于文本向量化的文本分类系统,所述系统包括,信息获取模块,用以获取各主题类型文本与待分类文本;关键词提取模块,对预处理后的各主题类型文本进行主题类型关键词提取;类型向量构建模块,对各主题类型文本的特征向量进行构建;文本向量构建模块,对待分类文本的各主题类型特征向量进行构建;文本分类模块,对待分类文本进行主题类型分类;异常分析模块,对待利博会登录网址查询分类文本分类的异常性进行分析;机器学习模块,根据监测周期内待分类文本分类异常性的分析结果与待分类文本的数量对下一监测周期待分类文本的主题类型分类过程进行优化。本发明提高了文本分类的准确性。