ぼくが、技術系記事を更新し続ける理由
2017年から、Qiitaにて技術周りの記事を投稿しています。
今年は計5本投稿しました。以下のような記事を書いてます。
『複数のアセンブラからコンセンサス配列を抽出する『Trycycler』を使ってみる』から。
学部生時代に取り組んでいたバイオインフォマティクス(生命情報科学)研究で解析ツールを使うことが多く、メモ代わりにQittaに記事を投稿していました。
僕自身もともと、他人が作った解析ツールを使うのが好きで、論文読んでみて興味を持ったツールは一通り使っていたりします。
このアルゴリズムはどんな特徴を持ったデータセットに適用できるのか、何がこれまでのツールと異なっているのか、ベンチマークがどう改善されているか、などを論文で読んでいると、プログラミングや数学、統計を通して、これまで見えてこなかった生物学的な傾向や特徴が明らかになっていき、それが楽しいです。
また、githubなど見ていると、開発者の試行錯誤によってツールが進化していく過程を見ることができて、自分の中で一つのエンタメになっています。
最初は自分のためのメモ程度でしたが、4年くらい続けているといろいろやっていて良かったことがあったので、記事を書いている理由を3つにまとめました。
1. 忘備録として
まず、最も大きい理由として自分の忘備録にできることです。
PCのローカル環境にメモすると自分しか読まないので丁寧に書かなくなり、1-2年経つと結局自分ですら解読できなくなっちゃうんですよね。
Qittaでオープンに公開することで、他人にも理解できるように書くようになるので、数年後の自分でも理解できるようになります。
もちろん、未発表の研究データや解析コードなど機密性が高いものはは、ローカルや、自分しか閲覧・書き込みできない形でクラウド上で管理しています。ちなみに論文や関連記事は、HackMDにMarkdownベースでまとめているんですが、HackMDは使いやすく非常におすすめです。
2. 他人の作ったツールはなかなか動かない
2つ目に、バイオインフォマティクスという分野自体が、ツール内の依存関係が複雑なことが多く、そもそもの実行の難易度が高いということがあります。
パイプライン系のツールなどは、複数のツールに依存していて、さらにそのツールにも依存関係があってもう頭がごちゃごちゃになります。
一つ一つを適当に野良ビルドしていたら、環境が壊れてしまったりするので、anacondaやhomebrewなどのパッケージ管理ツールを使うことも多いですが、また別の問題が起きたりします。最近は、dockerイメージを配布している開発者もいますが、まだ文化として根付いてはいないです。
そのため、まずツールをインストールしてテストするところが鬼門だったりします。初学者は、パスを変なところに通しちゃったり、pythonが5個くらいインストールされていたりりして開発環境がボロボロなことが多いです。
僕自身、「えいや!」とインストールを適当に進めて大変なことになったことが何度もあります。
そのため、Qiita記事にはインストールの部分から詳細に書くようにしています。用いたバージョン、インストール手法か、どんなエラーが出たか、など細かくメモしています。大抵のツールにはテストコードがあるので、インストールが完了した後に、テストコードの実行までをQiitaに記載しています。
『ショートリード配列から高速に薬剤耐性や病原性のタイピングをするSRST2を使う』から。
3. ポートフォリオ的な使い方が可能
僕が行っている解析受託事業において、Qiitaの記事自体がポートフォリオ的な役割を果たしていたりします。専門外の方が、委託先を探すために、論文や学会発表などの情報から得て、それがどのくらい自分たちの事業の助けになるのかを評価するのはコストも時間もかかってしまいます。
僕が書いているQiitaでは具体的な解析手法についてまとめているので、委託してくださる企業や研究者の方も自分たちの解析に必要か否かを判断しやすいですし、安心材料にもなっているのかなと思います。
とくにQIIME2の記事は、2年前に書いた記事でしたがとても好評でした。記事内で間違いやもっと良い手法があった場合は、数年前の記事でもできる限り更新しています。
『微生物群集解析ツール QIIME 2 を使う.Part2.(QC,FeatureTable生成編)』から。
こんなことをやっていると、「解析の受託事業を行っているのに、解析手法について詳細に書いちゃったら儲からないじゃん!」とよく言われますが、それ以上に、投稿した記事がシナジーを生むキッカケになっていると感じているので、これからも続けていきます!
まとめ
Qiitaに記事を投稿してから、記事を読んで実践してくださった方から質問を頂いたり、初めてお会いした分野が近い方から「Qiita参考にしています」など声をかけていただくことが増えました。素敵な出会いがたくさんあり、書いていてよかったな〜と思っています。
オープンサイエンスの時代に、自分が苦労して得た研究の知識は他の人が利用可能な形でオープンに残してあげることが重要だなと思います。
誰しも、間違ったことを書いてしまうことはありますが、サイエンス自体の"正しさ"も更新され続けるものなので、間違ったことがわかればその都度修正していけば良いかなと思います。
研究者間だけでデータや解析手法がオープンに利用できるようにするだけではなく、研究に携わりたい一般市民も含めてサイエンスを楽しめるようになってほしいと思います。本当の意味でサイエンスが民主化すればいいなと思っています。
最後に宣伝になってしまいますが、弊社ではマイクロバイオームや細菌単離株のゲノム解析、論文化や特許申請のお手伝いを受託しています。
解析の受託のご依頼に関して、気軽にご連絡ください。
株式会社ナノセカンド
E-mail: kouhei.976@gmail.com
アイコン画像は、unsplashから。