新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → 开发了一个C语言中文分词,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) [原创] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 19879 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 开发了一个C语言中文分词,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) [原创] 举报  打印  推荐  IE收藏夹 
       本主题类别: Description Logics    
     czw0001 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:58
      门派:XML.ORG.CN
      注册:2009/2/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给czw0001发送一个短消息 把czw0001加入好友 查看czw0001的个人资料 搜索czw0001在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看czw0001的博客楼主
    发贴心情 开发了一个C语言中文分词,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) [原创]

    开发了一个C语言中文分词,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) [原创]

    高速下载地址1: [URL=http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-217ac780f66411dd800065ed000065ed.html]http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-217ac780f66411dd800065ed000065ed.html[/URL]

    用法很简单,比如:你把中文分词系统解压后保存到D:\那你直接在 dos 窗口下输入:
    d:\cfenci.exe
    然后回车就可以了! 启动无需任何参数。

    目前系统在进行了大规模分词测试后的大致性能指标如下:
    1000字以内的文章完全切分,用时间不超过 10毫秒!
    5000字以内的文章完全切分,用时间不超过 500毫秒!
    10000字以内的文章完全切分,用时间不超过 1秒!
    本版本是简易版,分词准确率为 91.8%,系统稳定性为99.99%,符合工业化的标准!

    目前支持中英文混合切分词,各种全角,半角标点符号的过滤!
    系统自带词库含有 86万多个中文词汇!
    支持词汇的动态添加,新增词汇持久化保存!

    按此在新窗口浏览图片

    有需要提供动态链接库(dll)版本或Linux版本的,可以跟我联络!

    注1:词库文件是 cangzhuo.dat 请与分词程序 cfenci.exe 保存在同一目录下,另不得更改文件名,否则系统将无法加载词库!
    注2:测试用例文件是 测试内容.txt 仅供参考,无任何其他作用!
    注3:藏拙简易分词系统在遇到换行符的时候自动进行切分!所以在输入含有回车换行符的时候就认为输入完毕,开始切分!

    [URL=http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-4fbc5e80f7b111dd8000677800006678.html]中文分词系统DLL版出台了,并提供C,java,C#,delphi各种语言的DEMO和开发源码![/URL]


       收藏   分享  
    顶(1)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/2/15 19:56:00
     
     jyj407 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:73
      门派:XML.ORG.CN
      注册:2009/2/11

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jyj407发送一个短消息 把jyj407加入好友 查看jyj407的个人资料 搜索jyj407在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jyj407的博客2
    发贴心情 
    楼主好厉害啊,小弟佩服,佩服。来点掌声。。。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/2/15 20:10:00
     
     jyj407 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:73
      门派:XML.ORG.CN
      注册:2009/2/11

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jyj407发送一个短消息 把jyj407加入好友 查看jyj407的个人资料 搜索jyj407在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jyj407的博客3
    发贴心情 
    刚刚实验了一下,性能不错,谢谢楼主了。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/2/15 20:48:00
     
     木紫 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:2
      积分:59
      门派:XML.ORG.CN
      注册:2009/2/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给木紫发送一个短消息 把木紫加入好友 查看木紫的个人资料 搜索木紫在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看木紫的博客4
    发贴心情 
    up
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/2/18 22:16:00
     
     Slabin 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:73
      门派:XML.ORG.CN
      注册:2009/3/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Slabin发送一个短消息 把Slabin加入好友 查看Slabin的个人资料 搜索Slabin在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 点击这里发送电邮给Slabin  访问Slabin的主页 引用回复这个贴子 回复这个贴子 查看Slabin的博客5
    发贴心情 
    谢谢楼主分享,收下了。

    ----------------------------------------------
    人工智能爱好者基地,论坛[url=http://www.86ai.net]http://www.86ai.net[/url]个人空间,相册,源代码,视频,教程下载

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/3/28 22:50:00
     
     mi7qi 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:2
      积分:59
      门派:XML.ORG.CN
      注册:2010/3/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给mi7qi发送一个短消息 把mi7qi加入好友 查看mi7qi的个人资料 搜索mi7qi在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看mi7qi的博客6
    发贴心情 
    链接打不开啊
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/3/30 21:27:00
     
     lfrebecca 美女呀,离线,快来找我吧!
      
      
      等级:大一(猛啃高等数学)
      文章:22
      积分:158
      门派:XML.ORG.CN
      注册:2007/11/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给lfrebecca发送一个短消息 把lfrebecca加入好友 查看lfrebecca的个人资料 搜索lfrebecca在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看lfrebecca的博客7
    发贴心情 
    链接打不开呀,能发邮件给我吗
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/13 16:00:00
     
     ljh 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:70
      门派:XML.ORG.CN
      注册:2010/4/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ljh发送一个短消息 把ljh加入好友 查看ljh的个人资料 搜索ljh在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看ljh的博客8
    发贴心情 

    链接打不开呀

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/17 17:00:00
     
     hitwcq 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:61
      门派:XML.ORG.CN
      注册:2010/4/19

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给hitwcq发送一个短消息 把hitwcq加入好友 查看hitwcq的个人资料 搜索hitwcq在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看hitwcq的博客9
    发贴心情 
    厉害啊~~~~~~~~~~~~~~~~
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/19 18:24:00
     
     lhwy 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:64
      门派:XML.ORG.CN
      注册:2008/9/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给lhwy发送一个短消息 把lhwy加入好友 查看lhwy的个人资料 搜索lhwy在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看lhwy的博客10
    发贴心情 
    楼主链接打不开,楼主方便的话能不给我的邮箱发一个LINUX版本的,多谢
    我的邮箱是lhwy02jsj@gmail.com
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/27 11:14:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/8/6 20:30:52

    本主题贴数15,分页: [1] [2]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    93.750ms