20年以上変わらない習慣への挑戦

素材、マテリアル、材料。経済ニュース、大学の学科名、就活の際の企業研究などで見かけるこれらの言葉は実はかなり幅広いカテゴリのいろいろなものの総称です。私たちの身の回りにある物理的実体はすべて、それこそ窓ガラスやコンビニのポリ袋といった素朴なものから、砂粒サイズの高性能電子部品や半導体の製造工程に欠かせない特殊な液体といったハイテク系、あるいはボンネットの奥にある小さなフタの密閉性を上げる特殊ゴムのような地味なパーツまで、すべて「素材」です。まさに社会の素(もと)です。そして、それらの物理的実体一つ一つの背景には、膨大な研究開発と製造上のコツの蓄積があります。

大学や企業の研究室では、さらなる改良や革新的な新素材の発見を目指して今日も新しい知識が蓄積されています。素材の研究開発は「レシピを変えて試料を作り、いろいろな測定を行い、なにが起こっているかを考え、時に報告書にまとめ、次の一手を決める」というサイクルの繰り返しであり、各段階で異なるタイプのデータが生じます。しかし、実はこれらの多様なデータの多くは適切に管理されず、個人のPCやフォルダに埋もれ、組織レベルは言わずもがなチームレベルの資産にもなっていません。

こういった「データや情報をうまく管理できていない」という課題は、これまでもあらゆる組織のほとんどの部署で生じてきました。大抵の場合は、ソフトウェアを中心とした解決策が提示され、市場として成長し、技術や社会の発展によりまた新たなデータの課題が生じる、という変遷をたどります。しかし、素材の研究開発の現場はこのような変遷を辿らず、「データ管理はちゃんとできていないがExcel以外に使えるツールもないままなんとかやり過ごす」という状況がなんと20年以上続いています。つまり、最近課長になった40代前半の山田さんが2000年代に新卒で入社してから、素材研究の現場のデータ管理は本質的に何も変わっていません。

しかし、後述する様に、素材業界全体を巻き込む大きな変化が生じる中で、「そろそろちゃんとしなければならない」という機運が高まっています。ランデフトは、急激に顕在化しているこのデータ管理の課題、20年以上続く習慣に真正面から挑戦します。具体的には、研究開発プロセスで生じる多様な情報間の関係を整理・維持し、入力の負担を最小化しつつ利用者全員にメリットがある機能を持つプロダクト「Randeft」を提供し、利用を積極的に支援することで以下を実現します:

  • 情報共有の即時性向上
  • 可視化の負担を大幅軽減
  • データを資産にする文化の浸透
  • 多様なデータ活用を可能にする基盤の構築
  • 研究者が創造的思考に集中できる環境の構築

このページでは会社紹介の一環として、取り組む課題の背景、私たちがやること、やるべき理由を少し詳しくご紹介します。

なぜいま変革が必要なのか?

不便なところはあるもののずっと変わらなかったということは、不便なところに目を瞑ってもずっとどうにかなってきたとも言えます。しかし、ここ10年以内に起こった二つの変化により、多くの研究開発組織が「どうにかならなくなりそう」あるいは「もうどうにかしないとまずい」という危機感を抱いています。

データ駆動アプローチにすぐ使えるデータがない

最も顕著な変化はデータ駆動アプローチへの関心の高まりです。「データをうまく使うと素材の研究開発にもいいことがあるよ」という成果が学術論文だけではなく、ものづくり系オンラインメディアや業界新聞あるいは一般経済誌でも取り上げられるくらい、産業界におけるデータ活用への関心は高まっています。この関心の高まりは経営サイドでも見られ、上場企業の決算説明資料や中期経営計画にも研究開発活動におけるデータやデジタル技術を活用した革新について言及されるようになりました。この経営視点での関心の高まりは「研究DX」という検索キーワードのトレンドからもうかがえます(定義が曖昧なこの単語はあまり使いたくはないのですが、これ以外に広く使われていて定量的なトレンドを示せる単語がないのも事実なので採用しました)。

この20年間の「研究DX」という検索キーワードのトレンド

このような関心の高まりの結果、外部や中途採用のデータサイエンティストを集めて実験データを使ったデータ駆動型研究のテストプロジェクトを実行したところも多いはずです。しかし、すぐに使えるデータがない、つまりデータが資産となっていない状態でデータを活用しようとするとデータを準備する段階で非常に苦労します。

過去データを活用しようにも、紙の実験ノート、各人独自のExcelファイル、装置固有のフォーマットなど、これらを統合する前処理だけで膨大な労力が必要です。しかも専門知識に加えて関係者の異動や装置の修理・更新といった社内事情も解釈の質に関わってくる作業であるため、おいそれと外注もできません。

データの量や質には目をつぶり前処理には時間をかけずに、ひとまず数字やグラフを出してくれるモデル構築フェーズに進んでもgarbage in, garbage outの法則に直面します。いずれもよい結果を得ることが極めて難しい状態に陥ります。このような簡単に予想できる前処理の膨大さゆえに、興味はあるがPOCプロジェクトを実行するに至っていない企業も多いです。

一方で積み上がるデータ

以下の図が示すのは、産学の研究者が強力なX線を使う先端実験施設における測定データストレージ容量の変遷です(創業初期の会社紹介資料より)。2016年ごろからデータ増加スピードが上がっているのがわかります。これが二つ目の変化、データ生成スピードの加速です。主な要因は測定機器や周辺機器の進化です。測定に要する時間が短くなるとともに一度の測定から得られる情報量も向上しています。定量的に示せる数字こそありませんが、先端実験施設での進化が大学や企業の実験室にも波及することを考えると、実験室でもこれまで以上のスピードで測定データが増えていくことはほぼ間違いありません。

放射光施設SOLEILのストレージ容量の変化

このデータ増加に拍車をかけるのが、現在急激に関心が高まっているラボオートメーションや自動自律実験です。全てのプロセスを人間が行う現在のペースでもデータを資産にできていない状況で、自動化によりデータ取得速度が上がるとどうなるでしょう?あっという間に未評価あるいは吟味もできないデータが積み上がり、「せっかく測定したのだから」というやや説得力の欠ける(しかし非常に理解はできる)理由で消せないデータでストレージがパンパンに詰まっていくのは明らかです。解析パイプラインを整備すれば、理想的なデータ処理シナリオにおいてデータを無駄にすることはなくなりますが、トラブルシューティングやより深い考察をする際に測定結果を可視化する基本的な所作は相変わらず必要で、大量のデータから目的のものを探して次々と可視化するというニーズはより強くなるでしょう。

データ活用の理想と現実のギャップ

素材業界の研究開発部門に、データ駆動アプローチとラボオートメーションというこれまで経験したことのない大きな波が押し寄せる中、ここ数年で急激に進化した生成AIに対しても多くの企業が大きな期待を抱いています。期待の大きさはコーポレート・セールス・マーケティングといった部門よりは控えめに感じるものの、研究開発部門も例外ではありません。しかし、私たちは研究開発の現場にはAIの適用よりも前にやるべきことがあると考えており、それゆえにまだAIを製品の中心的技術には位置付けていません。それはデータの資産化と可視化です。

ベテランの知見が消える日

10年以上かかることも多い素材開発のサイクルをAIでいい感じに効率化できたときのインパクトは当然大きく、それを支援するプレイヤーも増えています。しかし、前述の通りデータ管理されていない現場では、必要なデータを準備するステップ自体に膨大な労力がかかります。実際に、データ駆動アプローチのPOCプロジェクト完了後に事前のデータ管理の重要さに気づくケースは多いようです。現場の様子をよく知らない方に向けて少し詳しく描写すると以下のような状況です。

冒頭で触れた通り、素材の研究開発のデータ管理は少なくとも20年前、大学や企業にExcel 2002が普及したころからほとんど変わっていません。大学の研究室でも大企業の研究所でもおおむね、実験室での作業記録を紙のノートに書き、測定結果をUSBメモリ経由で各自のPCへコピーし、Excelに数値部分をコピペして可視化し、報告書作成時には実験条件や測定結果をまたコピペする。この繰り返しです。また、比較が必要だったり結果を一覧表にしておきたい結果は各人が独自の方法で管理する「実験まとめ」などと呼ばれるExcelファイルにも保存されます。これらのファイルの保存場所が社内サーバーやクラウドサービスの共有フォルダであっても、個人名のついたフォルダが乱立し個人PCに保存していた時と実質的に同じことも多いです。

日々の業務の重要な記録が、手を動かした本人以外にわからない方法で蓄積されていると、次に起こることは誰でも想像がつきます。過去の実験や測定のデータの保存場所や文脈はその仕事をした本人しか把握できず、かろうじて残った報告書や図からは詳細情報が削ぎ落とされているため、異動・転職・退職によってその人の仕事の記録の大半が実質的に消失します。

つまり、5年前に退職したベテランの田中さんが在職中に試した数百件の合成パラメータとその数倍の測定結果のファイルは田中さんが整理してくれているはずですが、どこにあるかわからない、見つかっても読み解けない、あるいはそもそもその仕事の存在を知らない若手メンバーが田中さんと同じ実験を行う、という状況が十分にありえます。このような状況が20年以上「そういうもの」としてずっと続いている素材の研究開発の現場は非常に多いです。

データは存在するが、必要なときに使える状態にない。つまりデータが資産になっておらず、活用されないままストレージの肥やしとなっている。この状況は、重複実験、最適でない条件での質の悪い測定、問題解決の遅延、誤った意思決定など日常業務のあらゆる場面で大小様々な負の影響を生みます。また、データが整理されていない状態はAIを利用する際にも処理精度やスピードといった点でネガティブな影響があり、実用レベルでの活用に必要なモデルの性能や計算コスト、ユーザーの継続に直結するレスポンスの速さにも直結します。

このようにデータが資産化されていない問題は、人とAIの双方にとって深刻ですが、研究者の日常業務においてより直接的に創造性を阻害している問題があります。それが、測定データを『見る』という基本動作における非効率性です。

三徳包丁しかない厨房

研究開発部門におけるデータの資産化という課題には、セールス・マーケティング・経理など他部門のデータ資産化問題にはみられない特有の側面があります。データの多様性および可視化の頻繁さと面倒さです。

研究開発の過程で作製した試料は、素材の種類に応じて引張強度、電流電圧特性、X線回折といったそれぞれ全く性格の異なるさまざまな測定を実施します。ほとんどの場合、これらの測定の結果は長さや重さのような一つの数字ではなく、装置メーカー独自のバイナリフォーマットやテキスト形式でたくさんの数字の羅列として出力されるため、試料がパキッと折れる瞬間までにかかった力の変化、充電や放電時の電圧変化、結晶構造を反映した回折ピークの様子などの可視化が必須です。装置の隣にある装置制御PCにインストールされた装置メーカー製ソフトウェアであれば、独自のフォーマットの利点を使った整理・可視化・分析が簡単にできます。しかし、いろいろな事情によりテキスト形式で出力する一手間をかけてでも自分のPCで可視化や解析を行うことが多いのが実情です。

ここでも20年以上活躍しているのがExcelです。Excelなら、どんな装置でもCSVやテキストファイルで出力してしまえば可視化も解析も可能です。ダブルクリックでExcelが開かない拡張子でもメモ帳経由で数字の部分をコピー&ペーストすれば大丈夫です。複数の測定結果を比較したいときはコピペを繰り返し一つのExcelワークシートに集約すればよいし、複雑な処理をしたいときは途中の処理結果をカラムとして追加すれば割となんでもできます。しかも、支給されるPCにはほぼ確実にインストールされてすぐ使い始めることができます。

このようなExcelの万能さは、料理における三徳包丁の万能さにそっくりです。万能な道具が適切な道具とは限らないという意味でも似ています。毎日三徳包丁でジャガイモの皮をむくのがあまり良いやり方とは言えないように、毎日ひと手間ふた手間かけてExcelで測定結果を可視化するのは適切とは言えません。しかし、調理場にはピーラーを含めていろいろな包丁や道具がある一方で、研究開発の現場にはExcel以外の選択肢がほぼないのが現状です。

研究開発において測定結果の可視化は呼吸とも呼べる基本所作であり、日々の業務の様々な局面で頻繁に行われます。しかし現状では、この基本動作のたびに「メモ帳で開いてコピペ」「複数ファイルをExcelに集約」といった手作業を強いられます。データをすぐに使えないという課題の中でも、この「可視化の手間」が研究者の創造的思考を最も阻害している要因といっても過言ではありません。

そもそもなぜ20年以上変わらなかった?

資産化されないデータをストレージに溜め続け、日々の可視化もこなれないまま20年以上も変化がなかった理由はなぜか。学生時代も含め、その間ずっとアカデミアしか経験していない私には想像するしかできないこともあるものの、主要な原因は素材業界の研究開発の構造・文化的特徴とソフトウェアの支援不足の2つのカテゴリに大別されると考えられます。

構造と文化的特徴

大きな流行の不在

資産化されないデータをストレージに溜め続け、日々の可視化もこなれないまま20年以上も変化がなかった理由はなぜか。学生時代も含め、その間ずっとアカデミアしか経験していない私には想像するしかできないこともあるものの、主要な原因は素材業界の研究開発の構造・文化的特徴とソフトウェアの支援不足の2点だと私は考えています。

ハードウェア偏重予算

一台数百万円から数億円もする高額な分析装置は研究の要です。人件費以外の研究開発予算の大部分はこういったハードウェアと消耗品(あるいは分析の外注)に対して使われています。特別な解析・計算を行う高額なソフトウェアを除き、データをうまく扱うという目的でソフトウェアに予算が割かれることはほとんどなかったと想像します。この点には後述するソフトウェアの供給の少なさも関係していると考えます。

地味な作業への耐性

素材研究者の多くは、学生時代から地道な試行錯誤を積み重ねてきた人たちです。ミリグラム単位の計量、深夜の装置調整、合成失敗からのやり直しが当たり前の環境で鍛えられた忍耐力は、Excelでの非効率な作業を「そういうもの」として受け入れるには十分です。

ソフトウェア支援不足

課題が知られていない

素材メーカーの多い日本においては、素材に関わる学問を修めた研究開発人材は卒業・修了後に素材メーカーに就職し、転職する場合も同業メーカーに移るケースが多いため、素材の研究開発経験のある人材が他業種に流出すること自体が珍しかったのではないかと思っています。研究開発のような専門性の高い領域における課題はインサイダーでないとそもそも想像もつかない・知り得ないことが多いことを考えると、ソフトウェア開発業界のプレイヤーが素材業界の抱える課題について認識する機会は自ずと少なかっただろうと想像できます。

データが多様すぎる

ここまで「素材」と一括りにしてきましたが、実際には電子部品から特殊ゴム、機能性フィルムまで極めて多様です。素材ごとに重要な特性も測定装置も異なり、その掛け算で生じるデータのパターンは膨大です。以下はこの状況を私が関わっていた磁石の研究を例にして示した図です(創業初期の会社紹介資料より)。

素材の研究開発で生成されるデータの多様さ

もし素材業界のデータ管理の課題の存在を知ったとしても、このような多様なデータを個々の研究現場のニーズに合うように管理するソフトウェアを作ろうと考える開発会社はなかなかいないでしょう。特定の分野に特化すればデータの種類やユースケースも限定できるのでデータ管理製品も作りやすくなりますが、必然的にマーケットが小さくなりビジネスとしての魅力も下がってしまうため、あまり供給されてこなかったのでしょう。

ではランデフトはなにをするのか?

たくさんのデータから必要なものを早く取り出したいし、どんどん出てくるデータをこぼすことなく受け入れたい。となると必要なものは、整理するための箱です。しかも、データを入れやすく、見つけ出しやすい箱である必要があり、個性豊かな研究現場で多種多様なデータを受け入れられるような箱である必要があります。

また、私たちは単なる箱を提供するだけでは不十分だと考えています。なぜなら、過去にも多くの企業が研究開発データの管理ツールを導入したものの長続きしなかったケースが多いからです。複合的な要因の中で私たちが重要視する要因は、データ入力を負担する人にとって労力に見合う恩恵がなかった点と導入に際して適切な支援がなかったという点です。

そこで私たちは、データ管理の仕組みを構築する際に、「可視化」という所作を中心に機能を整備すると研究者が日常的に価値を感じられるようになり、自然と箱にデータも集まるだろうと考えました。データが集まれば、文脈が保持され、組織の知見が蓄積される。この好循環を生み出せる製品の提供と好循環を軌道に乗せる支援が、20年以上変わらなかった習慣を変革する鍵だと考えました。

文脈の保持と円滑な可視化

私たちがRandeftの基本機能として選んだのは、試料のレシピと測定結果ファイルの文脈を保持することとそれらの円滑な可視化です。データ駆動アプローチでも過去データの振り返りでも、試料と測定結果の関係が最も重要であり、なおかつ既存のソリューションがカバーしていない領域です。また、装置メーカーや測定手法を選ばない柔軟かつ円滑な可視化機能は、業務の様々な側面で幅広いユーザーに価値を提供できます。

不可欠な導入支援

20年以上続いたやり方を変えることは容易ではありません。そもそも、必要な時に必要な人が使えばよいタイプのツールとは異なり、データ管理製品は部署メンバー全員の業務の中心部に突然現れるものであり、多くの人にとってはすぐには受け入れにくい異物です。長く続く習慣の変容を迫る新しい仕組みを受け入れてもらうには適切なプロセスと配慮が必要です。私たちは、様々な素材の研究開発ワークフローや各種事情を深く理解するという自分たちの強みを活かし、ユーザーの業務やチーム構成の特性に応じた段階的な目標と導入計画を提案することで、ユーザー組織にできるだけ早くRandeft導入によるメリットを感じていただけるように導入過程に深く関与し支援します。

実現できていること

すでにRandeftは樹脂、ゴム、電池、機能性フィルムなどの多様な研究開発チームに導入されています。導入企業の7割がプライム上場企業、残りの3割もプライム上場相当の規模の非上場企業です。データ管理のROIは短期間でははっきりわからない上に、そもそも導入前の状況さえ定量化されていないことが多いため、まだ自慢できる数字はありません。しかし、取りやすい果実である可視化機能を中心に以下のようなポジティブな定性的評価をいただいています。

  • これまでは可視化とデータの集約のために「実験まとめ」のExcelファイルを作成してたが、Teamsのチャット内でリンクを貼るだけでデータ集約・可視化・共有が済むようになり、情報共有の即時性が大きく改善された。
  • 報告する側は可視化に関わる工数の負担が大きく軽減され、報告される側は負担のかかる可視化作業を催促しなければいけないストレスから解放された。
  • 定期的な報告会において、インタラクティブな測定チャートを利用することで議論が活性化された。また、議論に必要な過去の測定結果のチャートをその場ですぐに出せるようになり、回答を後日に先伸ばすことなく早い意思決定が可能になった。
  • これまで手間がかかるためあきらめていたデータの可視化が容易になったことで、過去の結果を参照するなどしてトラブル対応にかかるリードタイムが短縮された。

これらの可視化機能による効用は、非常にシンプルで分かりやすく、行動変容を促す際に必須となる小さな成功や、データを入力する人の恩恵として機能しデータ鮮度の保持に寄与しています。

次の30年のために

導入前ミーティングのためにある素材メーカーの研究所を訪問した際、研究所長から以下のような言葉をいただきました。

私たちが扱うデータは他の部門にも共有していない創業以来何十年もの積み重ね。これを次の30年のために使いたい。導入となったらすぐに消えてもらっては困る。

この言葉を聞いた時の気持ちは忘れられません。それまでも「ランデフトはユーザー企業の活動の中でも特に慎重に扱われるデータを預かるのだ」という自覚はありましたが、それは所詮「今」しかみてない視点でした。ユーザーから見たら、ランデフトは創業からの蓄積という「過去」を預け、次の30年という「未来」を一緒に作るパートナーなのです。

もちろん、20年間変わらなかったことを変えるのは大変です。膨大な「過去」を効率よく受け入れたり、30年分の「未来」を作るための機能もRandeftにはまだまだ足りていません。しかし、ソフトウェアによるレバレッジの恩恵を長いこと受けられず、個人の頑張りに頼りきりだった研究開発の現場が必要とする変革の第一歩は、適切なデータ管理体制を構築し可視化という研究開発の基本動作をできる限り容易にすることだと私は考えています。

適切なデータ管理の仕組みがない状態では、どれだけ優れた分析手法や自動化技術が登場しても、その恩恵を十分に受けることはできません。これは、測定装置の進化によってデータ量が加速度的に増加している現在において、特に重要な課題です。

データ駆動科学の果実はどれも美味しそうに見えますが、データ管理ができていない状態から手の届く高さにぶら下がっているものは多くありません。あったとしても思ったほど味の良いものではないでしょう。

研究開発現場の基本的なデータ管理の方法を20年ぶりに更新することは、確かに大きな変化と苦労と痛みを伴います。しかし、この変革なくしては、過去の膨大な知見を活かすことも、将来の効率的な研究開発も実現できないでしょう。

私たちは、素材の研究開発現場に必要とされるデータ管理の仕組みを提供し続けることで、研究者の日々の研究活動をより確実に、より価値のある成果へとつなげていきたいと考えています。