理研の「研究論文(STAP細胞)の疑義に関する調査中間報告」感想

追記1: 2014/03/16

ブコメにて

id:macgyer
小保方さんはもしかすると「対立遺伝子排除」という概念を知らず、わざわざストーリーに合うデータを間違えたデータに改竄したのかも。

との指摘がありましたが、重要性に気付かずにスルーしてました。申し訳ありません。
差し替えられたGel 2の該当レーン(論文では "Lymphocytes"、生データでは"CD45+/CD3+"とラベルされていたデータ)でも再構成されていないバンドが出るはずであるという指摘です。

何故そうなるかの詳細は下記URL参照。
対立遺伝子排除 - meddic


ちなみに、中間報告本文では

電気泳動されたサンプルについては、実験ノート類などの記載やサンプルチューブのラベルなど小保方氏から提供された各種の情報は、Figure 1i のレーン 1, 2, 4, 5 は論文の通りであること、論文で「Lymphocytes」とラベルされたレーン 3 は CD45+/CD3+ T リンパ球であることを示していた。

平成 26 年 3 月 13 日 研究論文の疑義に関する調査中間報告書 p5より


とあり、少なくとも実験ノートやサンプルチューブに書かれていたラベルに従えば、該当レーンは"CD45+/CD3+ T リンパ球"であるはずです………問題は実際の中身なんですが。また、上記の記述からはサンプルチューブが残っていると思われるので、調べてる人が本気だったら配列読むんじゃ無いですかね。中間報告のこの部分読んでると、ごまかそうとしてる小保方氏に対して突っ込み入れてたりするので結構本気で追求してるものと思われます。今後の報告に期待。

あと、以下は愚痴になりますが………大学や研究社会の中にいれば、実際に同様のデータで再構成前のバンドが出てるデータを示すことが出来たと思いますが、今の自分には確実に出るものなのかどうか裏付けるデータを見つけきれない状況です。関連論文や関連レビューへ自由にアクセス出来ない状況っていうのは(今更ではあるものの)もどかしいなあ。いやほんとに、大学の外から見た情報格差ってかなり絶望的な感じなんですよ。中の人は皮膚感覚としてわからないと思うけど。


以下本文



うーん。やっぱ何か結構色々とトホホな感じ。

研究論文(STAP細胞)の疑義に関する調査中間報告について | 理化学研究所 研究論文(STAP細胞)の疑義に関する調査中間報告について | 理化学研究所

の件なんだけど、個人的にはもうちょい立ち入った結論(第三者による生データ検証)を出して欲しかったんだけど、まあそれはしょうが無いかなあ(それで理研が信頼を失ったとしても困るのは理研だし)。

それよりも中間報告の中身が結構面白いというか………正直、首をひねってしまいます。特にFigure 1iについて、生データ見る限りではどうみてもNatureの投稿規定を破ってまで画像の偽造やるような必然性が無い感じです。で、生データは信頼できるんだからOKかというとそうでもなくて、ここまでカジュアルに切り貼り操作する人が作成した論文を信頼できるかって言うと、はっきり言って信頼出来ない(画像コピペ以外の手段で何かやってる可能性が否定出来ない)。
このモヤモヤ感というかヤバさというか、得体のしれなさを共有したいと思うので、Fig. 1の切り貼りについての感想を中心にまとめてみます。

そもそも切り貼りする必要って有ったの?

まず、以前から切り貼りが疑われており、今回の中間報告で画像の切り貼り操作が確定した画像がこれ。


f:id:ka-ka_xyz:20140314231719p:plain
調査委員会中間報告プレゼンファイル p8より引用。

今回の論文では、青矢印で示されている箇所に、別の電気泳動データが切り貼りされていました。
ちなみにこういうゲル電気泳動画像の切り貼りはNature誌の投稿規定では明確に禁止されており、かなりリスキーな行動です。そんでもって、案の定かなり初期の段階から「このデータ怪しくね?」と指摘されてました。

では、今回の中間報告で示された元の実験データ(Gel 1)を見てみましょう

f:id:ka-ka_xyz:20140314232327p:plain
調査委員会中間報告プレゼンファイル p9より、該当箇所を引用。

上に赤で名前が入ってるのが、論文で使用されたデータ。白字で"CD45+ cells"となってるのが、論文では無かったことにされたデータです。

いやデータ綺麗に取れてるじゃないか。いやまあ、低分子量側がぼやけてるって言えばぼやけてるけどそれはまあしょうが無いし、それ言ったら論文で使われてる隣のレーン(Sorted Oct4+ 1, Sorted Oct4+ 2)もぼやけてる。そのまま論文に使っても全く問題無いように見えます。
また、論文のストーリー的に"CD45+ cells"を酸に浸したら幹細胞マーカーが発現したっていう筋なんで、酸に浸す前後の比較って意味でも素直なデータの出し方に見えます。ちゃんとストーリーを考慮に入れたレーン構成。

で、"CD45+ cells"を切り貼りで上書きしてるのがこのデータ。

f:id:ka-ka_xyz:20140315005617p:plain
調査委員会中間報告プレゼンファイル p10より、該当箇所を引用。

サンプルがそもそもGel 1と違う("CD45+/CD3+"ってなってる。漏れが理解してる限りでは、T細胞受容体と結合するT細胞マーカー。今確認したけど論文本体にはCD3の話は出て無い)。まあ、取り敢えずT細胞を選別して*1TCR再構成を見てみたというデータなんだけど………何でこれをGel 1へ切り貼りしたの?あんまり切り貼りした意味無くね?だってTCR再構成を見るのであれば、Gel 1で元々出ていたデータで十分じゃないか。それにまあ、どうしてもこのサンプルでFig作りたいならもう一度電気泳動かけてデータ取り直せばいいんじゃね?中間報告書本文にはサンプルチューブ残ってるっていう記述もありますし*2

いや正直なところ、Fig. 1iの切り貼り疑惑については元データの画像を見るまでは、もっと救いようのない(切り貼りしないと論文のストーリーが破綻しそうな)データだと思ってたんですよ。画像の改ざんとか捏造ってさ、もうちょっと

「うわぁ決め手になるはずのデータが上手い具合に出ねぇぇぇぇ!この論文が出なかったら俺の人生詰む」とか
「何か論文で想定してたストーリーとは全く相反するデータが出ちゃったけど、今から一年分の実験をやり直したくない」とか
ノックアウトマウスで人生ノックアウト」とか
「ボスがこのデータ出しとけとか言いやがったけど一週間で出せるかボケが!」とか

こんな感じで良い具合に精神的に追い詰められた末にやるもんじゃね普通(いや普通ってのも変だけどさ)?職業倫理的にヤバイことを自覚しつつレッドラインを超えるか越えないか、追い詰められた末に踏み出すモノなんじゃね?*3

今回みたいに、敢えてリスクを取って切り貼りしてもしなくてもあんまり結果が変わらないというか、論文のストーリー的には差し替えないほうがむしろ良かったんじゃないかってデータに対してサクッと切り貼りをかます神経はちょっと理解不能。いやまあ、博論コピペとかでいろんなレベルでフリーダムな人とは認識してたけど、この舞台でこういうことやってしまうか…

で、怖いのはこんな風にカジュアルに改ざんをやる人が画像の改ざんだけで済ますかどうかっていう点でして。率直に言って、凄い信用出来ない。もっと深いところで何かやらかしていてもおかしくない。得体が知れない。

*1:「別の個体から改めて作成しなおしました」だと完全アウトというか意味がなくなるんだけど、今回の中間報告ではそこまで指摘されてない。

*2:Gel 2のバンドについては追記1も参照。

*3:まあこのへんはちょっと微妙かなという気もする。職業研究者経験無いんで、大分理想論で語ってる部分はあると自覚。