新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → [推荐]数据挖掘十大经典算法 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 28986 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [推荐]数据挖掘十大经典算法 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     hellojzz 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:95
      门派:XML.ORG.CN
      注册:2007/5/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给hellojzz发送一个短消息 把hellojzz加入好友 查看hellojzz的个人资料 搜索hellojzz在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看hellojzz的博客楼主
    发贴心情 [推荐]数据挖掘十大经典算法

    这是候选的18个算法!

    Classification
    ==============

    #1. C4.5

    Quinlan, J. R. 1993. C4.5: Programs for Machine Learning.
    Morgan Kaufmann Publishers Inc.


    #2. CART

    L. Breiman, J. Friedman, R. Olshen, and C. Stone. Classification and
    Regression Trees. Wadsworth, Belmont, CA, 1984.

    #3. K Nearest Neighbours (kNN)

    Hastie, T. and Tibshirani, R. 1996. Discriminant Adaptive Nearest
    Neighbor Classification. IEEE Trans. Pattern
    Anal. Mach. Intell. (TPAMI). 18, 6 (Jun. 1996), 607-616.
    DOI= http://dx.doi.org/10.1109/34.506411

    #4. Naive Bayes

    Hand, D.J., Yu, K., 2001. Idiot's Bayes: Not So Stupid After All?
    Internat. Statist. Rev. 69, 385-398.


    Statistical Learning
    ====================

    #5. SVM

    Vapnik, V. N. 1995. The Nature of Statistical Learning
    Theory. Springer-Verlag New York, Inc.

    #6. EM

    McLachlan, G. and Peel, D. (2000). Finite Mixture Models.
    J. Wiley, New York.


    Association Analysis
    ====================

    #7. Apriori

    Rakesh Agrawal and Ramakrishnan Srikant. Fast Algorithms for Mining
    Association Rules. In Proc. of the 20th Int'l Conference on Very Large
    Databases (VLDB '94), Santiago, Chile, September 1994.
    http://citeseer.comp.nus.edu.sg/agrawal94fast.html

    #8. FP-Tree

    Han, J., Pei, J., and Yin, Y. 2000. Mining frequent patterns without
    candidate generation. In Proceedings of the 2000 ACM SIGMOD
    international Conference on Management of Data (Dallas, Texas, United
    States, May 15 - 18, 2000). SIGMOD '00. ACM Press, New York, NY, 1-12.
    DOI= http://doi.acm.org/10.1145/342009.335372


    Link Mining
    ===========

    #9. PageRank

    Brin, S. and Page, L. 1998. The anatomy of a large-scale hypertextual
    Web search engine. In Proceedings of the Seventh international
    Conference on World Wide Web (WWW-7) (Brisbane,
    Australia). P. H. Enslow and A. Ellis, Eds. Elsevier Science
    Publishers B. V., Amsterdam, The Netherlands, 107-117.
    DOI= http://dx.doi.org/10.1016/S0169-7552(98)00110-X

    #10. HITS

    Kleinberg, J. M. 1998. Authoritative sources in a hyperlinked
    environment. In Proceedings of the Ninth Annual ACM-SIAM Symposium on
    Discrete Algorithms (San Francisco, California, United States, January
    25 - 27, 1998). Symposium on Discrete Algorithms. Society for
    Industrial and Applied Mathematics, Philadelphia, PA, 668-677.


    Clustering
    ==========

    #11. K-Means

    MacQueen, J. B., Some methods for classification and analysis of
    multivariate observations, in Proc. 5th Berkeley Symp. Mathematical
    Statistics and Probability, 1967, pp. 281-297.

    #12. BIRCH

    Zhang, T., Ramakrishnan, R., and Livny, M. 1996. BIRCH: an efficient
    data clustering method for very large databases. In Proceedings of the
    1996 ACM SIGMOD international Conference on Management of Data
    (Montreal, Quebec, Canada, June 04 - 06, 1996). J. Widom, Ed.
    SIGMOD '96. ACM Press, New York, NY, 103-114.
    DOI= http://doi.acm.org/10.1145/233269.233324


    Bagging and Boosting
    ====================

    #13. AdaBoost

    Freund, Y. and Schapire, R. E. 1997. A decision-theoretic
    generalization of on-line learning and an application to
    boosting. J. Comput. Syst. Sci. 55, 1 (Aug. 1997), 119-139.
    DOI= http://dx.doi.org/10.1006/jcss.1997.1504


    Sequential Patterns
    ===================

    #14. GSP

    Srikant, R. and Agrawal, R. 1996. Mining Sequential Patterns:
    Generalizations and Performance Improvements. In Proceedings of the
    5th international Conference on Extending Database Technology:
    Advances in Database Technology (March 25 - 29, 1996). P. M. Apers,
    M. Bouzeghoub, and G. Gardarin, Eds. Lecture Notes In Computer
    Science, vol. 1057. Springer-Verlag, London, 3-17.

    #15. PrefixSpan

    J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, U. Dayal and
    M-C. Hsu. PrefixSpan: Mining Sequential Patterns Efficiently by
    Prefix-Projected Pattern Growth. In Proceedings of the 17th
    international Conference on Data Engineering (April 02 - 06,
    2001). ICDE '01. IEEE Computer Society, Washington, DC.


    Integrated Mining
    =================

    #16. CBA

    Liu, B., Hsu, W. and Ma, Y. M. Integrating classification and
    association rule mining. KDD-98, 1998, pp. 80-86.
    http://citeseer.comp.nus.edu.sg/liu98integrating.html
      

    Rough Sets
    ==========

    #17. Finding reduct

    Zdzislaw Pawlak, Rough Sets: Theoretical Aspects of Reasoning about
    Data, Kluwer Academic Publishers, Norwell, MA, 1992


    Graph Mining
    ============

    #18. gSpan

    Yan, X. and Han, J. 2002. gSpan: Graph-Based Substructure Pattern
    Mining. In Proceedings of the 2002 IEEE International Conference on
    Data Mining (ICDM '02) (December 09 - 12, 2002). IEEE Computer
    Society, Washington, DC.


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/7/15 9:58:00
     
     DMman 帅哥哟,离线,有人找我吗?魔羯座1984-1-11
      
      
      威望:1
      头衔:数据挖掘青年
      等级:研二(Pi-Calculus看得一头雾水)(版主)
      文章:803
      积分:5806
      门派:W3CHINA.ORG
      注册:2007/4/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给DMman发送一个短消息 把DMman加入好友 查看DMman的个人资料 搜索DMman在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 点击这里发送电邮给DMman 访问DMman的主页 引用回复这个贴子 回复这个贴子 查看DMman的博客2
    发贴心情 
    不错的总结

    ----------------------------------------------
    数据挖掘青年 http://blogger.org.cn/blog/blog.asp?name=DMman
    纪录片之家 (很多纪录片下载)http://www.jlpzj.com/?fromuid=137653

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/7/15 16:37:00
     
     jessie77 美女呀,离线,快来找我吧!巨蟹座1982-7-7
      
      
      等级:大一新生
      文章:8
      积分:88
      门派:XML.ORG.CN
      注册:2007/9/6

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jessie77发送一个短消息 把jessie77加入好友 查看jessie77的个人资料 搜索jessie77在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jessie77的博客3
    发贴心情 
    谢谢楼主
    能详细的介绍一下吗
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/9/6 11:57:00
     
     第二天 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:6
      积分:84
      门派:XML.ORG.CN
      注册:2007/7/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给第二天发送一个短消息 把第二天加入好友 查看第二天的个人资料 搜索第二天在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看第二天的博客4
    发贴心情 
    好贴!谢谢分享
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/10 21:37:00
     
     mining 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:14
      积分:160
      门派:XML.ORG.CN
      注册:2005/4/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给mining发送一个短消息 把mining加入好友 查看mining的个人资料 搜索mining在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看mining的博客5
    发贴心情 
    搞粗糙集的人汗颜!
    研究这个东西的人那么多,大家都觉得这个理论性强,可是这些年粗糙集几乎没有开发出太成功的算法,最后的十大算法里find reduct算法也被淘汰了。

    这个是TKDE的主编组织很多人投票搞出来的一个统计结果,应该具有很高的可信度,基本反映了国际上对目前算法的看法。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/11 19:59:00
     
     第二天 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:6
      积分:84
      门派:XML.ORG.CN
      注册:2007/7/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给第二天发送一个短消息 把第二天加入好友 查看第二天的个人资料 搜索第二天在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看第二天的博客6
    发贴心情 
    好贴!谢谢楼主!
    楼主真的好厉害!看了你的主页,牛!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/11 20:03:00
     
     月亮忘记了 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:3
      积分:68
      门派:XML.ORG.CN
      注册:2008/3/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给月亮忘记了发送一个短消息 把月亮忘记了加入好友 查看月亮忘记了的个人资料 搜索月亮忘记了在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看月亮忘记了的博客7
    发贴心情 
    谢谢楼主
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/3/20 12:46:00
     
     周驰 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:62
      门派:XML.ORG.CN
      注册:2008/4/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给周驰发送一个短消息 把周驰加入好友 查看周驰的个人资料 搜索周驰在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看周驰的博客8
    发贴心情 
    都是很经典的算法啊。。。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/4/8 22:04:00
     
     ylzhu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:14
      积分:122
      门派:XML.ORG.CN
      注册:2010/12/26

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ylzhu发送一个短消息 把ylzhu加入好友 查看ylzhu的个人资料 搜索ylzhu在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看ylzhu的博客9
    发贴心情 
    谢谢啊!!很有用!!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/12/26 9:48:00
     
     w3china_wahaha 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:58
      门派:XML.ORG.CN
      注册:2011/10/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给w3china_wahaha发送一个短消息 把w3china_wahaha加入好友 查看w3china_wahaha的个人资料 搜索w3china_wahaha在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看w3china_wahaha的博客10
    发贴心情 
    总结得很好,可以好好研究下。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2011/10/9 16:56:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/8/7 2:18:16

    本主题贴数10,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    125.000ms