查看原文
其他

BMC Systems Biology没有学术不端

2017-08-07 薛宇 科学网

欢迎点击「科学网」↑关注我们!


先说点儿无关的事情。去年大约是国庆期间,老马微信上转了一篇磷酸化组鉴定的文章给我,是他们领域大牛R教授做的,发表在一个很不错的期刊上。老马说,你不是一直在做磷酸化吗,这是咱领域第一篇磷酸化组的工作,没准儿你会感兴趣。


文章我大约看了两分钟左右,打电话给老马,说这篇文章的组学鉴定和后面的数据分析都没有特别出彩的地方,能发到这个期刊,难道是因为这个实验的样本很难处理?老马哈哈一笑,答:说对了,这篇文章的亮点就是样本太难处理,实验技术太精细,全球就这一家能做得出来。


哦,明白了,挂了电话继续读论文,又看了两分钟觉得不对劲了,因为他里面有一整张图,应该是拿我做的软件绘制出来的。深吸了一口气,又花了一分钟时间仔细的看了全文,卧靠,居然没有引用我的文章。彻底愤怒了,立马打电话给老马,说这么搞不好吧?用我的东西连个引用都没有,这是典型的学术不端啊!老马答,咳,这肯定是学生做的老板没搞清楚状况,应该不是有意的。我说那不行啊,基本的学术规范还得讲啊,我得写信骂他去。老马说,别别别,R教授是好人啊。我说这两码的事儿。

话说咱搞生信的,最痛恨的事情就是别人用了自己东西,然后在文章里只字不提装作没有看见。做生物信息学,那也是在做科研好不好?我的东西,你用了凭什么可以不引用?当然这类事情过去十几年咱也不是第一次碰到了,历来都是发现一次写信过去骂一次。


挂了电话就写信给R教授,说我最近正在读一篇您的文章,琢磨着您有个图必须得是拿我做的工具画的,简单点儿,您就回答“是”还是“不是”就行了。


R教授当天就回信了,主要内容是第一,的确是用了我的工具;第二,他很抱歉因为疏忽没有引用,并且接受指责;第三,这个疏忽是无意的,并不是刻意要忽略我的工作;第四,R教授提议,是否可以发表一个勘误(Erratum)来加上引用?


R教授道歉,这个我是有预料的,一般来说大家做研究完全做到100%的规范是不可能的,有过失很正常。胖子有云,人是一定会犯错的,机器才不会犯错。有疏忽很正常,而且就过往的经历来看,一般咱写信过去抗议,对方都是客客气气道歉了事。


不过R教授说要加个Erratum,这个就过了,第一,人家道歉了,并且还很诚恳;第二,如果真要出个Erratum,那别人会不会觉得我得理不饶人?对吧,点到为止就得了。所以客客气气给人回信,说我态度不好请您原谅,以后欢迎您来中国访问。当然信末按惯例肯定要加上诸如兄弟我研究修饰十几年,各种软件、数据库一大堆,都是搞科研居家旅行忽悠编辑+审稿人的利器,欢迎合理使用云云。这种植入当然必须的,要有专业修养。

所以这事儿不大,人家道了歉事儿也就结了。后来几个月之后跟老马聊天又谈到这个事儿,老马张嘴就是R教授是好人啊。莞尔。


讲正事儿。7月21日好友转给我一篇公众号上的文章《[连载1]:学术期刊的学术不端,你见过吗?》,这是一个系列,总共有四篇,汇总在《从业超过10年,未见过如此厚颜无耻之人》。写这个系列文章的作者Y同学,个人网站上显示目前在香港大学博士在读,主要研究方向是流感病毒的进化。


这个系列的文章,讲的事情是Y同学在2010年以共同第一作者身份在咱生信的权威期刊Bioinformatics上发表了一篇论文,整合了当时已有的衡量GO注释条目语义学相似度的多种算法,用R语言设计了一个开放源代码的软件包GOSemSim,目前在Web ofScience里被引用178次,是ESI“高被引论文”。Y同学的论文发表之后,某一天发现有个工具ppiPre,发表在2013年的BMC Systems Biology上,通过融合GO注释的语义学相似性、信号通路相似性和网络拓扑相似性等多种特征建立了蛋白质-蛋白质相互作用预测的方法,其中GO注释语义学相似性的代码使用的是GOSemSim,既没有致谢也没有引用。


问题在于,ppiPre文章的第一作者,在论文发表之前还专门向Y同学请教过问题,所以无论如何,即使没有引用,最起码也应该是要有致谢的。所以Y同学写信给BMC Systems Biology的编辑,说这是抄袭要求处理。


Y同学的本意是希望制止这种行为,编辑部应该对这件事情进行处罚,理想的结果是撤稿。但后来BMC Systems Biology只出了一个勘误,作者致歉并注明引用,了事。所以Y同学认为期刊主编们这是在包庇抄袭,BMC Systems Biology学术不端。


中间的一个插曲是,Y同学后来发现ppiPre的作者2015年在PLOS ONE上发表的另一篇文章中的工具HPOSim,其代码与哈尔滨医科大学某研究组发表的DOSim相似,并且DOSim与之前德国学者设计的GOSim代码也相似,因此这属于恶意抄袭。这里面有两件事情需要讨论,第一,BMC Systems Biology有没有学术不端?第二,HPOSim、DOSim和GOSim代码相似是否属于抄袭?

先说第一个问题:BMC SystemsBiology没有学术不端。再说一遍,科学研究中100%不出错是不可能的,有错也分无意和恶意,不能一概而论。例如上面说到的R教授,用了我的东西既不引用也不致谢,如果作者是故意的,那就是学术不端了,但作者很诚恳地道了歉说这是无意的,所以撑死了也就是学术不够规范,当然无论哪种情况,如果我要求加Erratum那也是合理的。


此外,2013年Nature Biotechnology上发表了两篇利用网络方法推断分子之间直接相互作用的论文,这两篇文章都存在学术不规范的地方,其中Barabási组用的方法,之前有爱尔兰的学者在PNAS发过,但没有引用也没有致谢,所以作者写信给NBT抗议,Barabási以Response to Letter of Correspondence的形式很直接就承认了未有引用的过失;Kellis组则是论文接收后上线与正式出版的内容,其补充材料里两个版本有数据不一致,有篡改数据的嫌疑,并且被人发现之后还不承认错误,但即使是这样也够不上撤稿,所以是以勘误(Corrigendum)来纠正错误。

那么ppiPre究竟属于哪种情况?答:正式的名称叫“重用他人代码没有致谢”(Unacknowledged reuse of other code),属于比较常见的学术不规范行为。


生信的工具,代码有两种,一种是不开放源代码,另一种是开放源代码。不开放源代码的工具,一般工具开发完都会顺手申请个软件著作权进行保护,这样没有作者的授权,你是无论什么时候都不可以使用里面的代码,不然这就不是学术的问题了,人家会请律师告你。


另一种开源软件,代码允许他人重用,但也不是想怎么用就怎么用,要遵守一定的规范,例如要符合GPL等协议。那么究竟该怎样用他人的开源代码才符合学术规范?


这里我举两个例子。有德国学者使用了GOSemSim的代码设计了预测蛋白质相互作用的工具IntScore,发表在2012年的核酸研究上,作者专门写了一节来介绍GO的语义学相似性并且标明引用,所以这篇文章符合学术规范,没有问题。我们再看看DOSim,这篇文章里注明了GO注释的分析使用的是GOSim并且加了引用,所以也没有问题。

讲到这可能您就有疑问了,难道加个引用别人的代码就可以直接拿过来用?答:必须的,但仅限开源代码。因为开源代码就是鼓励他人共享、重用、改进和完善已有代码,并且基于开源代码设计的工具对他人也必须得是开源的。


所以,要使用别人的代码,首先要看清楚代码是开源还是不开源的;其次是用了开源代码,论文中要引用,致谢里最好要有体现,如果还不放心,最好在代码里加注释,把别人的代码标注出来。当然如果还不放心的话,可以再给作者写封信问代码能不能用以及怎么用。当然如果还是不放心的话,最好是论文接收之后proof之前再给作者写封信问这么引用是否合适。安全第一,学术规范我们得遵守,即使是无心之过也应当尽力避免。

BMC Systems Biology对ppiPre的认定就是“重用他人代码没有致谢”,这个认定是准确的,处理方式就是作者需要道歉,补发一个Erratum来说明情况并且加上引用。这个不光是BMC Systems Biology会这么做,其他杂志也会是一样的处理。学术期刊上的论文,并不是我们想发就可以发,发表后想撤也不是那么容易就可以撤的,即使是作者要求撤稿,编辑们也得仔细衡量,该怎么处理会怎么处理。

这样第二个问题就很容易回答了:HPOSim、DOSim和GOSim代码相似不属于抄袭。其中DOSim在方法学部分引用了GOSim的文章,所以符合学术规范,没有任何问题。而HPOSim只是在介绍部分引用DOSim和GOSim,方法学部分没有说明也没有致谢,因此仍然属于“重用他人代码没有致谢”。

最后,这个系列文章里讲的事情,事实上从一开头的处理就不合适。处理学术研究中的各种问题和纠纷,这里面要讲个方式方法。


第一,GOSemSim这篇文章,除了Y同学以外还有一位共同第一作者,并且还有两位共同通讯作者,所以一般得先是向通讯作者汇报,最后由通讯作者代表所有的作者写信给对方或者编辑部。为什么要这样?这是因为论文发表,杂志社都会要求通讯作者签署版权或者协议(Copyright or license),这样以后出现与这篇文章相关的问题,通讯作者有责任也有义务来解决。


第二,一般通讯作者会更有经验,对问题把握会更准确,出手也会比较注意尺度和力度,这样编辑看了会觉得有说服力,而且通讯作者一般也大致会对处置的结果有比较准确的预判。例如,用了我的东西没有引用也没有致谢,不管是我学生还是我发现的,最后都是我去写信批评人家。比方说我给R教授写信,就只是问有没有用我的工具。都是聪明人,话不需要说的那么透,点到为止就得了。


那您要问,如果人家不回信或者耍赖说没用呢?很简单,三天不回信我会立马写信杂志社,说作者用了我的东西并且刻意没有引用也没有致谢,态度极其恶劣建议撤稿,并且把我三天前发的信抄给编辑作为证据。当然即使是这样,编辑也不可能撤稿,不过会逼着作者老老实实道歉发Erratum。可惜的是,这么多年来,我从来没有碰到这种情况,几乎发信过去24小时内必然收到道歉。


第三,Y同学写信给编辑部之后,编辑部必然要给ppiPre的作者写信要求解释。收到编辑部的来信,正确的处理方式,应该是由ppiPre论文的通讯作者写信给GOSemSim的两位通讯作者,首先要道歉,承认有错误,学术不够规范;其次是请求对方的谅解,并询问应该如何处理。HPOSim的处理方式与此同。所以这件事情,无论如何论文的通讯作者之间都需要有充分的沟通和商讨。显然,之前这个环节处理的不够好,所以后面才会整出来这么多事情。

最后,学术研究中碰到的问题,应该有合理的解决方法。科学家应当自律,我们做研究一定要严谨,失误虽然不能避免,但有错就应该及时道歉和纠正。

转载本文请联系原作者获取授权,同时请注明本文来自薛宇科学网博客。
链接地址:http://blog.sciencenet.cn/blog-404304-1069933.html

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存