博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
文本分类资源和程序开源共享
阅读量:5282 次
发布时间:2019-06-14

本文共 504 字,大约阅读时间需要 1 分钟。

作者:finallyly 出处:博客园 (转载请注明 作者和出处)

前言:

感谢dudu和博客园的支持,我于2010年10月曾在博客园的个人博客中发布了个人整理的汉语新闻分类语料,以及文本分类流程程序。 历时两年收到了广大网友的支持、批评和指正。现在面临毕业,所以对自己硕士阶段的工作进行了部分开源。

文本语料库(包括中英文新闻)的详细说明以及下载地址为:

文本分类程序最新版的详细说明以及下载地址为:

文本分类的中间表达形式VSM模型的详细说明以及下载地址为:

(1)英文语料的VSM模型: 

(2)中文语料的VSM模型:

 同时也欢迎大家关注 中科院自动化所的其他数据,如有数据需求,欢迎下载,更欢迎留下您宝贵的反馈意见。

关于文本分类程序说明,以及语料说明的博文地址为:

 我们还会开源更多的资源和程序,如果您对中文DBLP感兴趣,欢迎关注我的,以及我们在数据堂建立的个人数据专区。专区用于资源共享,博客将会给出相应的算法设计,和代码使用说明。

同时欢迎大家关注 

 

转载于:https://www.cnblogs.com/finallyliuyu/archive/2012/01/15/2322721.html

你可能感兴趣的文章
P1970 花匠
查看>>
java语言与java技术
查看>>
NOIP2016提高A组五校联考2总结
查看>>
iOS 项目的编译速度提高
查看>>
table中checkbox选择多行
查看>>
Magento开发文档(三):Magento控制器
查看>>
性能调优攻略
查看>>
ie6解决png图片透明问题
查看>>
瞬间的永恒
查看>>
2019-8-5 考试总结
查看>>
JS中实现字符串和数组的相互转化
查看>>
web service和ejb的区别
查看>>
Windows Azure Cloud Service (29) 在Windows Azure发送邮件(下)
查看>>
微信上传素材返回 '{"errcode":41005,"errmsg":"media data missing"}',php5.6返回
查看>>
div或者p标签单行和多行超出显示省略号
查看>>
Elasticsearch 滚动重启 必读
查看>>
Hadoop基本概念
查看>>
java.util.zip压缩打包文件总结一:压缩文件及文件下面的文件夹
查看>>
浅说 apache setenvif_module模块
查看>>
MySQL--数据插入
查看>>