首頁/ 健康/ 正文

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

以下文章來源於新智元,知乎

北理工碩士抄襲事件剛過去不久,近日,又有一起學術不端行為被網友舉報,作者竟是復旦大學重點實驗室的研究生!

相比於此前內容的一比一復刻,這次則是對 9 年前頂會論文來了一個

「英譯中」

其中涉及到的論文分別為:

於 2017 年發表在期刊《計算機應用與軟體》上的《基於正則表示式構建學習的網頁資訊抽取方法》。

於 2008 年發表在自然語言處理頂會EMNLP上《Regular Expression Learning for Information Extraction》。

教科書般的「英譯中」

下面,我們將會為大家演示,如何「翻譯」一篇英語文獻並在之後進行發表。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

https://aclanthology。org/D08-1003。pdf

http://www。shcas。net/jsjyup/pdf/2017/2/基於正則表示式構建學習的網頁資訊抽取方法。pdf

摘要

通看全文,中文論文的行文邏輯和英文原版幾乎完全一致。

首先,讓我們從摘要看起。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

英文論文

「正則表示式」是「資訊抽取」的「常用方法」。「高質量且複雜的正則表示式」需要「人工成本」,為此,提出「。。。演算法」。

左:英文譯文;右:中文論文

引言

引言部分更誇張一些,幾乎所有的關鍵詞都被直接挪用了過去。

至少在之前的摘要部分還是做了相當一部分「原創」的。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

英文論文

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文譯文;右:中文論文

問題描述

如果說之前只是語言上的相似,那麼接下來在第二章「2 The Regex Learning Problem (正則學習問題)」和「2 問題描述」中,內容重複之多,可以說就是「一字不差」地照搬了。

首先,在問題的定義和變數的設定上,都是構造「正負」例子匹配結果的兩個集合。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

英文論文

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文譯文;右:中文論文

在問題的闡述中,都提到了一個假設和三個定義,且關鍵處內容高度相似,僅僅更換了個別字母的使用。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

英文論文

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文譯文;右:中文論文

原作者提出的演算法「ReLIE 」和中文稿的「正則表示式構建學習演算法」從演算法的變數定義,到執行的語法結構也完全一樣。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文論文;右:中文論文

實驗分析

實驗結果也是大差不差,下圖左邊原文在四個任務(SoftwareName、CourseNumber、 URL 和 PhoneNumber )上進行正則表示式的抽取,右邊中文論文也在四個任務(電話號碼、課程程式碼、超連結任務和公司名稱)上抽取,實驗所用的任務名稱完全一樣,實驗圖的走勢也高度接近。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文論文;右:中文論文

此外,文中還有多處公式雷同。

比如,對目標函式的定義(中文論文第二個公式貌似還是錯的。。。):

左:英文論文;右:中文論文

時間複雜度的計算公式:

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

左:英文論文;右:中文論文

就連實驗的資料彙總表的格式也是一樣的。

左:英文論文;右:中文論文

出於對科研的敬畏

事件被多方曝光之後引來了不小的熱度。

而網上的傳言也越來越離譜,從一個CS教授為什麼會看中文水刊,到這是要錘復旦的陰謀論。

為此,在昨晚,事件的第一發現者再次發文表示,自己舉報完全是出於對科研的敬畏,並附上了發給原作者舉報抄襲的郵件截圖。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

此外,也貼出了自己在 2021 年 10 月 20 日下午 6 點發的朋友圈。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

(節選)

該網友表示,自己就是一名在國內讀大學的大四本科生,目前在公司實習,因為業務上涉及使用正則表示式篩選資料。

最開始在Google Scholar上找到了IBM的那篇工作,但是感覺有些晦澀難懂,於是就決定去中文網站搜尋一下相關的資訊,然後就找到了這篇疑似抄襲的論文。經過和引文論文的對比,發現果然是一模一樣的。

此外,網友表示,復旦大學是我國最好的大學之一,為科技、社會的發展,做出了不可估量的貢獻。自己非常尊敬復旦大學每一位認真科研、學習的老師和同學。

雖然自己並不是全職做科研的博士或者教授,但作為一個瞭解過科研艱辛的人,不能容許別人肆意竊取這樣的成果。

實錘舉報!復旦碩士被爆「英譯中」 9 年前頂會論文並發表

這位網友相信,即便這件事在中文學術上是微不足道的,但如果大家也能在發現抄襲之後就隨手進行曝光和舉報,我們的學術環境一定會越來越好。

網友力挺

一早起來,知乎這一問題下面已經有了好多人的評論。他們都表示了對這個造假髮現者和舉報者的支援:

「唉,要是每個同行都像你這樣求真務實就好了。」

「做的對,向你致敬。淨化學術氛圍,人人有責。」

最近的多起學術不端行為,給學術研究者一個大大的提醒,那就是科研工作者一定要求真,求實,對學術誠信要有敬畏之心,絕不能踏過紅線,不要有僥倖心理,否則就是自毀前程。每位科研工作者在做好自己的工作時,也要懂得尊重他人的學術成果。

同時,科研工作者既是論文的產出者,也要做學術誠信的監督者,這樣,才能推動學術發展欣欣向榮。

參考資料:

https://www。zhihu。com/question/493606496/answer/2183263738

https://aclanthology。org/D08-1003/

http://www。shcas。net/jsjyup/pdf/2017/2/基於正則表示式構建學習的網頁資訊抽取方法。pdf

編輯:Lnysay

題圖來源:自制

相關文章

頂部