新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → 关于数据集与源代码 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 256928 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: 关于数据集与源代码 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     eyounx 帅哥哟,离线,有人找我吗?金牛座1982-5-3
      
      
      威望:9
      等级:大四(GRE考了1400分!)(版主)
      文章:272
      积分:1260
      门派:GOOGLEBBS.NET
      注册:2005/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给eyounx发送一个短消息 把eyounx加入好友 查看eyounx的个人资料 搜索eyounx在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问eyounx的主页 引用回复这个贴子 回复这个贴子 查看eyounx的博客楼主
    发贴心情 关于数据集与源代码

    任务繁重,好久没有来这里了,真是愧对版主职责。

    看到很多人要数据集和源代码,这里说几句,

    UCI数据集是一个常用的标准测试数据集,下载地址在
    http://www.ics.uci.edu/~mlearn/MLRepository.html
    我的主页上也有整理好的一些UCI数据集:
    http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip

    在看别人的论文时,别人使用的数据集会给出数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)。如果你看的论文没有给出数据集的出处,请立即停止看这篇论文,并且停止看刊发这篇论文的期刊上的所有文章。因为可以断定这些文章质量很差。

    关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
    http://www.cs.waikato.ac.nz/ml/weka/
    很多的机器学习的经典算法都在里面。而且公布源程序,易于修改。

    如果作者没有公布源程序,可以到作者主页找找,也可以写信给作者要,一般论文开头都会有作者的email地址。写信的时候要注意要很有礼貌,否则作者,尤其是著名学者,很有可能不会理睬。如果算法简单,可以自己实现。

    关于论文的下载,如果能够访问电子图书馆是最好的,很多学校都买了IEEE, Elsevier, Kluwer等,上面的期刊都不错。有一些很好的期刊是免费的,像JAIR和JMLR,分别在:
    http://www.cs.washington.edu/research/jair/home.html
    http://www.jmlr.org/
    如果能访问的免费期刊太少,可以到CiteSeer上搜索(http://citeseer.ist.psu.edu/),上面搜集了很多免费论文(但是要注意,论文的质量参差不齐),或者用Google(www.google.com)搜索。

    再嘱咐两点,要做研究,首先要打好基础,例如数学基础和程序设计能力,要学会熟练使用google等搜索引擎,还有一定要看高质量的论文。


       收藏   分享  
    顶(3)
      




    ----------------------------------------------
    member of LAMDA, CS, NJU
    http://lamda.nju.edu.cn/
    http://lamda.nju.edu.cn/yuy

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/10/21 0:56:00
     
     GoogleAdSense金牛座1982-5-3
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/1 9:41:20

    本主题贴数57,分页: [1] [2] [3] [4]... [6]

     *树形目录 (最近20个回帖) 顶端 
    主题:  关于数据集与源代码(1474字) - eyounx,2005年10月21日
        回复:  哈哈,我又回来了。赞一个。(26字) - wendyneil,2015年9月14日
        回复:  UCI测试是不是太专门了一些,领域不同的可能要引入知识做先验调整吧。,谢谢楼主提供资源,刚进来。..(93字) - wincentto,2015年5月1日
        回复:  同意楼主说法,论文要是不标明数据集的引用,基本上不可信。前两天发现了一个找数据集的好地方,叫数据堂..(178字) - datatree,2011年8月10日
        回复:  谢谢楼主,很有用的帖子!(24字) - ylzhu,2011年3月10日
        回复:  thanks a lot!(13字) - djboy1971,2010年12月27日
        回复:  经济、网络等方面的EI检索论文转让http://www.17winner.com/News/Sh..(185字) - 92960,2010年10月26日
        回复:  醍醐灌顶啊,谢谢(16字) - liqun8438,2010年5月22日
        回复:  版主 我想问一下ARFF文件用什么软件打开呀?是WEKA吗?在哪下呀?谢谢..(65字) - cutegirl2451,2010年5月6日
        回复:  真是好人呀 请问怎么积分呀(25字) - cutegirl2451,2010年5月6日
        回复:  俺是学数学的 代码都编不出来(29字) - lbylwxz,2009年12月8日
        回复:  多谢多谢多谢多谢(16字) - 哪吒闹海,2009年9月3日
        回复:  楼主:上次登录: 2007-11-21 13:30:00 ?可惜啊!..(53字) - 好好学习,2009年4月27日
        回复:  支持(4字) - tanjunlu,2009年4月26日
        回复:  谢谢楼主分享!!!!(16字) - ieee.org,2009年3月7日
        回复:  赞一个!(8字) - jyj407,2009年2月15日
        回复:  感谢楼主(8字) - shawnyoung,2008年9月19日
        回复:  感谢感谢!!(12字) - mjl_1103,2008年8月28日
        回复:  好帖(4字) - ljdiao,2008年7月29日
        回复:  确实如此,做起来易!(20字) - pawkitty,2008年7月22日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    140.625ms