新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → 急  请教高手统计学习理论中的VC维概念 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 7547 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 急  请教高手统计学习理论中的VC维概念 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     windrider 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:52
      门派:XML.ORG.CN
      注册:2008/5/13

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给windrider发送一个短消息 把windrider加入好友 查看windrider的个人资料 搜索windrider在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看windrider的博客楼主
    发贴心情 急  请教高手统计学习理论中的VC维概念

    VC维:对一个指示函数集,如果存在h个样本能够被函数集中的函数按所有可能的2的h次方种形式分开,则称函数集能够把h个样本打散,则函数集的VC维就是它能打散的最大样本数目h

    请教怎么叫存在h个样本能够被函数集中的函数按所有可能的2的h次方种形式分开?
    非常着急,希望得到回答 :))


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/13 20:54:00
     
     Alfredy 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:65
      门派:IEEE.ORG.CN
      注册:2009/11/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Alfredy发送一个短消息 把Alfredy加入好友 查看Alfredy的个人资料 搜索Alfredy在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Alfredy的博客2
    发贴心情 
    假定我们有一个数据集,包含N个点。这N个点可以用2n种方法标记为正例和负例。因此,N个数据点可以定义种不同的学习问题。如果对于这些问题中的任何一个,我们都能够找到一个假设h∈将正例和负例分开,那么我们就称散列N个点。也就是说,可以用N个点定义的任何的学习问题都能够用一个从中抽取的假设无误差地学习。可以被散列的点的最大数量称为的VC维
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/1/9 15:46:00
     
     graduter 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:81
      门派:XML.ORG.CN
      注册:2009/11/7

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给graduter发送一个短消息 把graduter加入好友 查看graduter的个人资料 搜索graduter在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看graduter的博客3
    发贴心情 
    VC维的直观定义是:对一个指标函数集,如果存在h 个样本能够被函数集中的函数按所有可能的2h种形式分开,则称函数集能够把h个样本打散;函数集的VC维就是它能打散的最大样本数目h。若对任意数目的样本都有函数能将它们打散,则函数集的VC维是无穷大,有界实函数的VC维可以通过用一定的阀值将它转化成指示函数来定义。
    故有这样的结论,平面内只能找到3个点能被直线打散而不找到第4个。
    对于这个结论我是如下理解的:
    (1)平面内只能找到3个点能被直线打散:直线只能把一堆点分成两堆,对于3个点,要分成两堆加上顺序就有23种。其中A、B、C表示3个点,+1,-1表示堆的类别, {A→-1,BC→+1}表示A分在标号为-1的那堆,B和C分在标号为+1的那堆。这就是一种分发。以此类推。则有如下8种分法:
    {A→-1,BC→+1},{A→+1,BC→-1}
    {B→-1,AC→+1},{B→+1,BC→-1}
    {C→-1,AB→+1},{C→+1,BC→-1}
    {ABC→-1},{ABC→+1}
    (2)找不到4个点。假设有,则应该有24=16分法,但是把四个点分成两堆有:一堆一个点另一对三个点(1,3);两两均分(2,2);一堆四个另一堆没有(0,4)三种情况。对于第一种情况,4个点可分别做一次一个一堆的,加上顺序就有8种:
    {A→-1,BCD→+1},{A→+1,BCD→-1}
    {B→-1,ACD→+1},{B→+1,ACD→-1}
    {C→-1,ABD→+1},{C→+1,ABD→-1}
    {D→-1,ABC→+1},{D→+1,ABC→-1};
    对于第二种情况有4种:
    {AB→-1,CD→+1},{AB→+1,CD→-1}
    {AC→-1,BD→+1},{AC→+1,BD→-1}
    没有一条直线能使AD在一堆,BC在一堆,因为A、D处在对角线位置,B、C处在对角线位置。(这是我直观在图上找出来的)
    对于第三种情况有2种;
    {ABCD→-1}
    {ABCD→+1}
    所以总共加起来只有8+4+2=14种分法,不满足24=16分法,所以平面找不到4个点能被直线打散。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/3/31 10:47:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/8/6 2:37:30

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    61.523ms