やればできる卒論の書き方 第3部 研究者と社会

中田 亨


「精神のない専門家、魂のない享楽的な人間。
この無にひとしい人は、自分が人間性のかつてない最高の段階に到達したのだと、自惚れるだろう」

—マックス・ウェーバー『プロテスタンティズムの倫理と資本主義の精神』(中山元・訳、日経BPクラシックス)

研究と不正行為 (Academic Fraud)

残念ながら、自然科学研究にからんだ不正行為は、規模の差はあれ、ある程度の割合で行われていると考えられる。実際、大きな事件なら年に2〜3件は新聞沙汰になっているし、小さな事件でも米国では不正を監視する役所(医学生物学関連のみであるが Office of Research Integrity, ORI)が不正調査結果を公表している。

卒論研究は教育訓練であり、研究成果の質は問われない。(「何を考え、何をやり、何が起こり、何が分かったか」を報告すれば満点である。)したがって、本来は不正をする理由はあまりなく、学生の見栄程度である。しかし、卒論→口頭発表→学会誌発表→学界的権利化(研究資金の申請、学生の進学先や仕事のポスト探し)→金銭的権利化(特許や製品化)と進んでいくと、不正への誘惑が増し、事件性も帯びてくる。

よくある不正行為:

  1. データの操作:データの捏造(data fabrication)。不利データの隠蔽。データ処理方法の乱用。
  2. 盗用:他人の努力を自分のものにする。貢献していない人が執筆者リストに入る(幽霊著者、Gift authorship, 研究業績のプレゼント行為)。
  3. 業績の水増し:重複投稿。
  4. 知的財産権の窃盗:アイデアを考えついた人に発明の権利が付与されるという法を破ること。職務発明は慣例や法解釈が変化しつつあり、青色LED裁判などで注目されている。学生の発明については、学生の権利保護のための制度化が遅れている。

不正が露見すると、対外的信用失墜、就職取り消し、研究資金申請の禁止などの罰が待ちかまえている。研究者としては事実上の死である。

しかし、不正を実態的に防止するための、取締り法・規則、不正告発を受け捜査する専従組織、業績の正当性を保証する学会制度、研究者の意識などはかなり不十分である。ばれない、すぐにはばれない、ばれたとて大したことないと、制度の不備が誘惑を助長している向きもある。

「嘘をついてもどうせ追試や実用化段階でばれるから厳重な検査は無用」と楽観して、どこの国でも防止策がまじめに考えられてこなかった。だが現実の事件に多いのは、

などの理由である。いずれにしても「正々の旗、堂々の陣」ではない。

PTENデータ捏造事件では、Nature Medicine に発表した論文に著者が14人もいる。いざ露見すると1人だけが悪いことで収めようとしている。Gift authorshipを逆手にとって責任追及を逃れるとはスゴイ。

また厳格査読を誇るNature Medicineといえども、チェックできないことも分かる。医学関係などの現象は、理論による完全説明が難しい場合があり、そうした分野では査読は困難になる。(理論づくの物理学ですらウソの論文が Science 誌に載ったりする。ベル研究所超伝導捏造事件(2002年)) そもそも著者が14人もいるのは、かなり胡散臭い。編集部はその点を追及するべきだったが、してない。

2005年9月14日の新聞報道によれば、当時、東大教授でまた産総研センター長でもあった研究者が、Natureなどに発表したRNAの研究論文に正当性の疑いがあるとのこと。生データ(計測ホヤホヤで未加工のデータ)が提示できないというから、願望データかしら。数年にわたり12本もの論文を願望データで作れるものなのか。教授は「担当者は再実験できると言っている」と言っているらしいが、これは“幽霊著者だったのは認めるから、トカゲのしっぽ切りさせて”作戦。(「私が実験した時はそうなった!私は見た!」と徹底抗戦するのが筋。責任著者なんだから。一流誌に載るほどの優れた実験結果なら、著者でなくても「現物を見せて!やって見せて!」となるはず。研究員とボスは、実験机の前で現物と研究ノートをつつきながら議論すべし。)

トップの科学者による一流誌上での捏造論文事件例はきりが無い。ウンウンヘキシウム元素捏造事件(2002年)、 ソウル大ES細胞捏造事件(2005年12月)、などなど。

個人の不正行為だけでなく、学界に風潮自体にも問題がある。トップ・クォーク発見論文 (“Observation of the Top Quark,” 1995)は著者が403人もいる。403人全員がそれぞれの部分を独立で主体的に発想したということになる。一人当たり何文字か。明らかに、研究資金獲得グループメンバ(≠発見者)や機械操作員や傍観的上司が、発見者(=責任著者)に混じっている。この論文の著者リストはなぜかアルファベット順なので、労力・才能・幸運・名誉を等分している。(仮にN等分されているとする。業績には非線形性があり、N<403となるのでおトクなのが、誘惑の元である。)本当に働いた人が哀れである。

こうした不正を助長する大きな要因に、論文の著者リストのシステムがある。貢献と責任の順に著者を並べるのであるが、順序だけならごまかしが効く。(この点、米国特許庁は厳格で、幽霊発明者が混入している場合は、特許を取り消す。)本来なら、映画のエンドロールのように、○○さんは何を考え付きました、□□さんは何を計画しました、△△さんは何を発見しどう解釈しましたと、説明を伴って記述すべきである。(最近、新聞や雑誌上で、論文捏造の防止法について、いろいろな意見が提起されている。だが、著者リスト制度を改めるというシンプルな意見は見受けられない。ここが急所だと私は思うのだが。)

誘惑は常にある。研究指導者は、学生がデータにごまかしをしていないか、かなり厳重に監視する必要がある。

誘惑にかられている学生は、無理をすることはない。不成功なら不成功なりに報告すればよい。「どこまでは目論見通りにいった」と発表できる。(そもそも、大抵の研究発表とはそんなものだろう。成功か失敗かは世間への影響を見てないと本当はわからない。)1年や2年、留年して研究をまっとうに仕上げる道もある。研究室を変えるもの楽しい。中退でも高学歴である。不正はネットにいつまでも書き残されるのでキツイ!

「すてておけ!そんなものに心動かされたことはない!」(森川久美『天の戴冠』)

研究者の成果評価の方式も変わろうとしている。かつては一流論文誌に多くの論文を掲載することだけが評価された。Natureなどに載ったら万々歳だった。インパクトファクターなる数字が持てはやされた。過騰競争だった。だが事件に見られるように、この評価方法は(細分化された科学の論文は査読が難しいため)信頼性に乏しく、誘惑も大きい。今は、研究の実用化、実社会の問題への学者の参画、出版やメディア露出、一般人を巻き込んだ活動など、世間のお役に立つこと・影響を与えることを評価するように変わりつつある。「料理を作ったら、自分で毒見して、自分で売ってこい」というわけである。この評価システムで、効率が良いか、精度が高いか、学者像としてどうなのかは分からないが、しょうがない。

大学院進学を考えている人は、下記の本を読んで考えて下さい。

「わたしは学者業をつづけておりますが、この種の職業では広く他人の教えを受け、他人に自分をさらけ出さねばなりません。だからこの職業には、秀才意識は邪魔になります。」(森嶋通夫『学校・学歴・人生』)

<<ご注意! 有意水準は事前に1つだけに決めること>>

統計手法の乱用のうち、非常に多いものが、「一つの分析に複数の有意水準を使用すること」である。「*:p<0.05, **: p< 0.01, ***: p < 0.001」という水準併用は、論文にあってはならない。

学会によっては、この方法が多数派になっているところがあるので深刻である。(いわんやwikipediaの記事でも平然と認めている。)これはなんとデータの改竄に当たる。世間にあまり知られていない、データ改竄形態なので、特に注意を要する。

「差の再現性」(=有意水準)を「差の威力」にすり替える
例えば、薬Aと薬Bで、Aの効き目が 235±2 で、Bの効き目が 230±1 であると計測できたとする。効果に大差はないが、再現性は圧倒的である。したがって、Aを実態以上に良く見せたければ、論文では「有意水準***です!」と強調すれば、しめたもの。
 一般的に、サンプル数を膨大に増やせば、厳しい有意水準でもクリアしやすくなる。例えば、通常ならサンプル100個で有意水準1%ぐらいで充分な実験なのに、金をジャブジャブ持っている研究者がサンプル数を500個にして、無駄に厳しい有意水準0.1%をクリアするということも可能である。こうすれば、なんだかすごい発見・発明に見せかけられるわけだ。金の力で論文の品質に下駄をはかせているのである。
研究者の期待願望効果(confirmation bias)が生じる
有意水準を複数用意する研究者は、自分の期待する結果を“統計的に確認した”と発表し、自分の期待に反する結果を“有意ではなかった”と黙殺する偏見効果が生じる。
 なぜかというと、「あともう少しで予想どおりの結果になるのに」と思っているなら、ゆるい有意水準(p<0.05など)を論文に書いてしまえばよい。
 「これは予想に反するかもしれない」と思える傾向に対して、わざわざゆるい有意水準を持ち出して「私の予想に反する傾向が無くは無いです」などと論文を混乱させるのはバカバカしい。しらばっくれて、厳しい有意水準だけを論文に登場させるだろう。
 要するに差別待遇なのである。
 一つ一つの論文だけに限れば、この偏見効果は明確には見て取れない。しかし、何本も発表するうちに、その研究者にとってやっかいなデータだけを黙殺する偏見効果が、明らかに表れる。

実験サンプル数と有意水準の決め方

予備実験と本実験の二段構えで望む。まず、予備実験を行い少数のサンプルを得る。そのデータから、ノイズの大きさを観察し、本実験で必要なサンプル数を割り出す。 予備実験のデータの役割はこれで終わりであり、論文の結論の支持には用いてはならない。予備実験のデータを本実験のデータに統合してはいけない。

有意水準の一般的は目安は次の通り:

【有意水準5%】 

【有意水準1%】

【有意水準0.1%】


詳しくはブルーバックスをご覧ください。
講談社ブルーバックス 講談社ブルーバックスより「理系のための即効!卒業論文術」


「卒論の書き方 第1部 論文の書き方」に戻る