新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Biomatics, Gene Ontology(基因本体)
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机技术与应用『 生物信息学 』 → 信息定义的标准化 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 22171 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 信息定义的标准化 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     ogogo 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:0
      积分:52
      门派:XML.ORG.CN
      注册:2006/8/10

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ogogo发送一个短消息 把ogogo加入好友 查看ogogo的个人资料 搜索ogogo在『 生物信息学 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看ogogo的博客楼主
    发贴心情 信息定义的标准化

    Standardization of Information Definition
    Deng Yu et al
    First Hospital, Tsinghua University, Beijing 100016.

    Abstract  Nowadays information definition has a direction that is super abundance and floating, taken explanations serve as definition, so, information definition needs to decrease fat for normalization and standardization. It is standard model of information definiens that definiens of “species plus differentia”. According to the criterion of “definition”, we altered Shannon’s and Wiener’s information definitions, from negative form have changed affirmation, inverse Shannon’s information definition: information is increase of determinacy; invert of Wiener’s information definition: information is logo of matter, energy and message. And/or we advanced formulized definition about concept of conservation of information, and information essence definiens: information is a set of mark of attribute of thing. Standardization of information definition can check availably non-criterion definition to deluge.
    Keywords  information definition;  standardization;  specific concept plus differentia;  Law of conservation of information

    信息定义的标准化

    邓宇        deng
    清华大学第一附属医院 北京100016     
    摘要 现在的信息定义有过多过泛之势,多把解释当成定义。因此信息的定义需要规范化、标准化的瘦身。“属加种差”的界定是信息定义的标准化模式。按照“定义”的标准,我们改造了Shannon和Wiener的信息定义,由否定式变肯定式,既逆Shannon信息定义:信息是确定性的增加;及Wiener信息定义的逆:信息就是信息,信息是物质、能量、信息的标示。及我们提出的”信息守恒”概念与公式化的定义,与“信息是事物及其属性标识的集合”的信息实质定义。信息定义的标准化可以有效抑止不规范定义的泛滥。
    关键词   信息定义     标准化    属加种差   信息守恒定律

    信息社会,信息时代,信息爆炸,信息定义也深陷其中,呈爆炸趋势。信息界各家探索者都要给信息下个自己的定义,是个爱好者就要给个“信息的本质定义”或统一的定义,大有“信息定义”泛滥之势。众多的“所谓信息定义”,虽独立,但个性不强,多没有跳出前人的圈框,多属模仿跟随,组合,有创意的少。而且大有“信息定义”的个数和字数越来越陈长的趋向。现在是需要给“信息定义”一个正名、缩减的时候了。“信息定义的标准化”就是规范信息定义的基础的基础。2000年我们尝试,按照逻辑学“概念的定义”界定标准“属概念加种差”的方式,给出了信息实质的新定义:“信息是事物现象属性标识的集合”。【1~3】该定义有耳目一新的感觉,从而引发了新一轮的“信息是事物属性×××(标识:表征、反映、映像)……”类的信息新定义类别及‘集合’概念复热的小爆发。
    以往,形式上太多样的‘信息定义’需要精简。一方面,在定义的数量上要猛减,能统一成一个是信息界的理想(短时间内达不到);另一方面,信息定义在字数上要精炼简短,消除沉长、冗余。统一的公认的‘信息定义’几乎没有,各衷一事,各执一词的太多。出现频率最高,最具权威,常被引用的还当数Shannon, 维纳,……钟义信的经典‘定义’——解释。但三位大师的定义还不是终极,难免疏漏。又如,信息是情报;信息是消息;信息是知识;信息是数据;……等,都与定义的规则1不合:定义项外延窄了;与规则2也有悖:有循环和同语反复嫌疑,定义项间接包含了被定义项,解释当定义使了。故信息的定义只有在‘信息定义的标准化’后,‘统一的信息定义’才有可能‘一统’,若联‘定义’是什么都不清楚,给出的所谓‘信息的定义’能是定义吗!恐怕不能,权且算个‘信息解释’吧!
    欲给“信息的定义”标准化,就先要搞清楚“定义”的界定,暨‘定义’的标准化模式。定义的标准化就是让“信息定义”符合“定义”的要求、规则,暨定义的标准,既有个大家都需要共同遵守的“界定”的准则、规范。

    1 “定义”的定义  
    1.1 ‘定义’的概念。定义是揭示概念内涵的逻辑方法,就是用简单明确的方式来揭示词项所指称的事物的特有属性、或词项本身的含义或所指的明确词项内涵的逻辑方法。换句话说,定义是指出概念对象特有属性,从而使该概念对象和其他类似对象区别开的一种揭示概念内涵的逻辑方法。定义是任何特殊情况下判定一个术语适用性所用标准(各种操作)的总和。逻辑学上的科学定义即“属概念加种差”定义法,是指被定义概念的属概念加上被定义概念的种差的一种定义方法。这里,有一个属概念,一个种概念。种差是指某一个种概念在同一属要领下与其他种属概念的区别。

    1.2 定义的组成,即定义形式化‘标准’表述。定义的一般表达式(通式):Ds是Dp

    被定义项+定义联项+定义项=定义
    即任何定义都是由‘被定义项Ds’、‘定义联项‘是’’和‘定义项Dp’三部分组成。象句法的“系表”或“主谓宾”结构。
    被定义项是需要加以明确的概念被称为‘被定义项’;用来明确被定义项的概念称为‘定义项’,联结被定义项和定义项的词语称为‘定义联项’。

    1.3常用的几种定义方式暨定义的种类
      1.3.1‘属加种差’定义方式(或称内涵定义)。这种定义方式由如下公式表出:
         被定义项=邻近的属+种差。
      1.3.2构造定义方式 (又称发生定义方式)。它是属加种差定义方式派生出来的一种特殊形式,是用一类事物产生或形成情况作为种差所作出的定义。
      发生定义按概念产生的过程,给出了构造程序。故又称为构造定义。
      1.3.3关系定义方式。关系定义是以事物间的关系作为种差的定义。它指出这种关系是被定义事物所具有而任何其它事物所不具有的本质属性。
      1.3.4概括定义 (又称外延定义)。与内涵定义呼应,是用并列的种概念给属概念下定义的方法。在外延定义中被定义项是属,定义项是几个种的并集,实质是直接指出被定义项所指对象的外延。
      1.3.5语词定义方式。语词定义就是说明或规定语词或词组的意义的定义。
    1.3.6公理定义方式。就是用一组公理来描述被定义项概念的本质属性的定义方式。
    1.3.7递归定义。当被定义项与自然数的性质直接有关时,在数学中常采用递归定义。
    对照上述‘定义’的7个界定,发现已有的传统‘信息定义’或多或少都不够“定义”,即原有‘信息定义’的“内涵”“外延”界定的模糊,属概念、种差的界定凌乱,缺东少西,有属没种差,有种差没属概念,或者两者全无的混乱局面。以致搞IT的不屑“信息定义”,只搞技术,不搞ITh(Theory)。传统众多算不上‘定义’的定义,更是因为与下述界定的‘规则’相左,只能算是信息定义的‘解释’了。

    1.4定义的规则
      规则1.定义必须是相称的。即被定义项的外延和定义项的外延必须全同。
      规则2.定义不得循环。指定义项中不能直接或间接地包含被定义项。
      规则3.定义一般不用否定形式。给概念下定义应表示被定义项具有某种属性,用否定的形式只能表示被定义项不具有某种属性。这样定义项就没有揭示事物的本质属性。
      规则4.定义应当是确定的、简明的。即定义不能有含糊不清的语词。
    传统‘信息定义’多是违犯‘定义的规则1’的,是“不相称”的。如,Shannon和Wiener等的信息定义,他们的‘被定义项’——信息其实外延很宽,而‘定义项’——不确定度等确窄了。Shannon定义应该是第8种定义:‘技术定义’,有发生定义的影子。它偏向IT——技术,却缺少IS(信息科学)、社会和人文的外延,与规则1难符。Wiener的定义,先抛开规则3不谈,他的外延起码少了‘事件、事体、事情’等并列的种概念。另外Wiener与Shannon定义的‘否定或准否定形式’是‘信息定义’的大忌——规则3的大逆。也就引发了我们后面对两位大师‘信息定义’的斗胆修补——“逆Shannon和Wiener定义”。使两者原来的‘否定式’变成“肯定式”。

    2 “信息定义”的其他标准,或上述标准的杂解。数学是个严密的学科,信息科学的定义应尽量符合数学样定义的要诀,即数学的严密、严谨,充要,科学,经济。说白了就是“信息的好定义”应该象数学的定义、定理一样,‘多一个字就多了,少一个字就少了’经济简练,不可或缺,逻辑合理,自恰,精准——精致准确(正确性),精炼。‘信息定义’还应符合语言文字的语法句法。‘定义项’或定义全体有“主谓宾或系表”等句法结构为好。

    3 ‘定义就是定义’,不是解释。‘解释’就是解释,不是定义。不要将定义弄成概念的解释,用‘解释’去当‘定义’,这就错位了。因此,众多已经出现过的和按传统习惯将要模仿制出的所谓信息的定义,其实不是“定义”层面的“定义”,甚至更不用说是严格意义上的‘信息定义’。实际上,他们更合‘解释’界定的标准,不是下定义,更是下“解释”。当然没有了定义的(逻辑)自恰,严谨,经济简练。

    4 现有信息定义的问题:共性问题。1.形式上不规范,不是定义所规定的‘界定形式’,既不是‘内涵式定义:属加种差定义’,也不是‘外延式定义’:各个种概念的并集(全集合),更不是发生式定义、公理定义、递归定义、词语定义等,不是真定义,而是“解释”。2.不符合‘定义的四规则’:不相称;有循环;否定式;不确定、不简明(不经济)。如维纳和香农的否定式定义。3.其他问题,扩大化,缩小化(专业局限化),泛化。‘定义’与‘解释’混为一谈。把明明是‘信息解释’的东西说成是‘信息定义’。定义与解释概念上的严重混淆。
    大部分所谓“信息定义”多不合第一条规则:既外延不同。也有有悖“规则2,3”的,既间接包含被定义项和用否定形式。‘维纳’的“信息既不是物质,也不是能量,信息就是信息”就明显属于不合规则3(否定式)。另外,单单用物质,能量外延也小了,起码少了实体以外的东西。比如少了事体、事件、事情,和信息本身等,概括性小了。若变成肯定式就行了。

    拿上述这几条定义的标准及规则与已经出现过的百多条信息定义,比较对照,就能看出他们各自的不足。如,并列定义,例的外延不全等。“信息是被反映的……”类定义;“信息是……的反映(映射)”类定义;“信息是……的差异(变异度)” 类定义;“信息是……的度量” 类定义;“信息是…混乱度…的度量”等;“信息是物质的普遍属性”——到象是信息的性质,不像定义。其中,“信息是被反映的……”“被动式”的使用与“规则3”有些靠谱。若用“主动式”表达会更明确贴切,语义更直接。斗胆给出,增加一条暂未被公认的“定义的规则”
    规则5. 定义一般不用被动形式。用“主动式”对揭示被定义项的属性更确定更直白。被动式有多绕圈的感觉。这个规则5是可以商榷的。希望学界,特别是“逻辑学”界给出成立、与不成的说法和理由!

    5 问题定义的修补:“否定式”改成“肯定式”。
    5.1 仙农信息定义逆:将著名的否定式的维纳和仙农的“信息定义”换成“肯定式”成为仙农(香农)信息定义逆1——仙农信息定义的逆定义1:
    信息是确定性的增加。
    或仙农信息逆定义2:
    信息是确认肯定性(确定性)的东西。

    信息是肯定性的确认。
    对应公式
    Ir=-logPi+1

    Ir‘=log((N-ni)/N)=log(nq/N)=logPq
    即仙农信息,由形式上的负熵——不确定度,变换成形式上的正熵补——确定度。见原否定式的Shannon信息定义:信息是消除随机不定性的东西。公式
    I=-logPi=-log((ni)/N) =-(logni-logN)=logN-log ni
    =-log((N-nq)/N)=1-1- logPi=1-(1+ logPi)=(1- logPi) –1

    5.2 维纳信息定义逆:信息是物质、能量、信息的logo(标示,表示、表号——表现符号、信号、标号,表征、标识)。或“信息是与物质、能量、信息及属性相伴随的标识(logo,标示)”;或“信息就是信息,是物质、能量、信息的标识(表征、……)”。
    5.3 钟义信定义的小缩:信息是事物变化状态的方式。

    6 信息标准定义举例
    6.1 信息守恒的定义:信息类“概念的定义”最好是标准的“属+种差”的定义,将来也会出现“公理定义”、“发生定义”等真定义。若出现‘关系定义’也不奇怪。以“信息守恒定律【2~13】”为例,看看如何标准的界定“信息守恒的概念”。也是霍金(Professor Stephen Hawking)们反复关注十多年的大问题。信息守恒与转换定律(基本信息方程式)的定义1:
    总的流进系统的信息必等于总的从系统中流出的信息,加上系统内部信息的变化;信息能够转换,从一种状态转变成另一种状态;信息可以创造,可以失存。用公式表示为
    NQ= NW +ΔNU
    象我们新提出的“信息守恒定律基本方程式[10]”与“信息守恒:N=∑ni”这个概念的定义(定律的定义)2:信息守恒定律是指“系统中储存信息的增加等于进入系统的信息减去离开系统的信息”
    ΔNU= NQ-NW
    系统中储存信息的变化=进入系统的信息-离开系统的信息     
    =新创造的信息-失去(‘消失’离开)的信息
    由“系统中信息的变化=进入系统的信息-离开系统的信息”而变换为“(信息)可以创造,可以失存”的‘信息守恒概念’的发生定义:系统中信息的变化等于进入系统的新创造的信息减去系统失去(离开、失存、消失、消灭)的信息。是信息转换守恒定律特有属性,本质内涵的:“信息可以创造,可以失存”的原创表达公式:
    系统中储存信息的变化=新创造的信息-失存的信息
    ΔNU =Ncre-Nlos
    由“信息守恒定律”的界定过程可以寅生出新的“下定义的”1.3.8公式定义方式:是用公式来描述被定义项概念内涵,关系,规律的特有本质属性的定义方式。他有关系定义的影子,是公理定义,外延定义等的提炼集合。

    6.2 信息本质与新定义:“信息是事物及其属性标识的集合”Deng’s的定义。

    信息是事物及其属性标识的集合
    ↑        ↑      ↑
    被定义项  属概念   种差

    是在我们信息实质新定义:“信息是事物属性标识的集合”基础上的发展,既附加一个稍许注释:“信息是事物及其属性标识的集合”。在‘事物’与‘属性’之间特别强调地加入了并列共容的‘及其’联结。突出择理出:1.信息是‘事物标识的集合’;2.信息是‘属性标识的集合’;3.信息是‘事物的属性的标识的集合’;4. 信息是‘事物和/或属性的标识的集合’,信息是‘事物和/或属性的属性标识的集合’。潜含的几层蕴意。‘事物’是“事”与“物”的大汇合,强调信息不光来自“物质”更来源于“事”和/或“物”,也来自“属性”本身,是物理信息、化学信息、生物的信息,及“物质的信息”、“能量的信息”、“信息的信息”的升华,既“信息(属性)也是信息的信息”——属性标识的集合。
    总之,什么不是下定义呢? 1.分类不是下定义。2.比喻不是下定义。3.成因不是下定义。4.解释不是下定义。“属概念+种差”才是标准的真定义。故以前出现的大部分所谓“信息的定义”,其实只是“信息的解释”,而够不上严格意义上的“定义”。比如,缺了许多种概念的“不完整的外延类定义”,信息是情报;信息是消息(间接包含被定义项,是隐循环)的解释等。按照“定义”的规则,传统所谓的信息定义应该划分为两部分:一部分是“信息的定义”;另一类只是“信息的解释”,是需要引起信息科学和理论界注意的问题。两者不能混淆,需要按定义的标准和规则行事,不应再用“解释”当“定义”。

    参考文献
    1.钟义信,信息科学原理,福建人民出版社,1988 。
    2.邓宇,中医中西结合医学理论基础现代化研究的创新突破,中国医学月刊,2002,1(8):672-676。
    3.邓宇,邓海,邓非,信息守恒律与信息实质定义, 中华医学荟萃杂志, 2003, 3(3):2-4。
    4.Elsberry, Wesley, and Jeffrey Shallit. Information theory, evolutionary computation, and Dembski's "complex specified information"., 2003, http://www.talkreason.org /articles/ eandsdembski. pdf。
    5.Erik, On Dembsky Law of Conservation of Information, 2002, http://talkreason. org/ articles/ dembski_ LCI.pdf。
    6.Scott M. Hitchcock. Is There a 'Conservation of Information Law' for the Universe? 2001,http://arxiv.org/PS_ cache/gr- qc/pdf/0108/0108010.pdf。
    7.Tocasons , Every wave is made of tiny drops. Reflections on Stephen Hawking and the paradox of information loss. 2004, http://www.threemonkeysonline.com/threemon_ article_ paradox_ information_ loss_ stephen_ hawking.htm。
    8.邓宇,邓海,生物-非生物界的信息守恒律与双大超循环世界图景,数理医药学杂志,2000,13(1):88-89。
    9.邓宇,邓海,热效率趋向100%的能量利用新途径I:从无序到有序,中国工程热物理学会工程热力学与能源利用学术会议,1994,941053。
    10.邓宇,邓非,邓海等,生物信息论第一定律:信息守恒定律的基本方程式,中华新医学杂志,2005,6(17):2094-2096。
    11.邓宇,语义信息的新语义创造,数理医药学杂志,2004,17(6):537-539。
    12. 邓宇,量子论新诠释的数字实验模拟,中华医学研究杂志,2004,26:30-31。
    13. 邓宇,信息的新实质定义与基因信息,数理医药学杂志,2004,17(5):450-452。


       收藏   分享  
    顶(1)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/8/10 10:18:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 生物信息学 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 6:50:43

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    78.125ms