初心者向け:Controlled Terminology(CT)の選び方
この記事はSDTMデータセットの仕様書を作成する初心者向けに、用語(Controlled Terminology)の選び方の概要を示しています。
2024/05/01:追記
はじめに
SDTM変換仕様書を作成する際に、公式用語(Controlled Terminology/CT)から正しい用語を選ぶ作業が発生します。用語の選択方法についてはこれといった情報がまとまっていないことも多く、初心者にとっては壁の一つとなります。
1. 採用するCTバージョンを確かめる
まずは、その試験で採用するCTのバージョンを決めましょう(もしくは、確かめましょう)。誰かが決定している場合もありますし、何かの仕組みがあって自動的に決定されているかもしれません。
もし、未決定であれば作業を進める前に必ず確定させておきます。
2. TSドメインの中身を確認する
SDTMのTSデータセットにはTSCDVERという変数があります。TSドメインには臨床試験の情報を埋め込みますが、その際に公式用語が使われることがあります。このようなケースではTSCDVER変数に公式用語のバージョンを明記する必要があります(下図)。
TSドメインに対しては、ひな型が用意されていることがしばしばあるのですが、テンプレートのTSCDVER変数の値がそのまま放置されていたり、TSVAL変数の値が公式用語のそれではないといったケースが散見されます。かなりの高確率で見逃されるポイントなので、早めに対処しておきましょう。
3. 公式用語集を検索する
具体的な用語を調べるために、公式用語をダウンロードしましょう。公式用語一式はCDISC公式サイトには掲載されていません。National Cancer Institute(アメリカ国立がん研究所)のウェブサイトからダウンロードします。
CDISCでは各種標準を策定していますが、用語に関しては独自に作成をしていません。用語集を乱立させるのではなく、既存の用語集を利用しています。こうすることで、用語集の作成・管理を任せられますし、同じ用語集を採用しているデータと連結が可能になります。かなり早い段階でCDISCはこの判断を下しており、CDISC標準の世界で働く人にとっては暗黙の了解となっています。ですが「暗黙知」だけに、初心者にとっては躓きやすいポイントです。
4. 却下された用語追加リクエストを見る
公式用語集で自分が欲しい用語がばっちり見つかればよいのですが、そうでないことも多いでしょう。そのような場合、色々と調査したり、うーんと悩んだりするわけですが、その前に試しておくべきことがあります。
CDISCの公式用語集は年に二回更新されています(※)。更新にあたっては世界中のCDISCのユーザーからリクエストを集め、評価を行っています。当然、全てのリクエストが採用されることはなく、様々な理由でリクエストが却下されています。この却下情報はCDISCの公式サイトにて公開されています。
「却下されたCTリクエスト」は2013年ごろから累積で蓄積されています。この中には「別の用語を使うべきなので却下」といったコメントがついています。『公式用語集で検索したけど見つからない』ワードを、そのまま検索にかけると、それなりにヒットします。
却下された理由を読むことで推奨される用語が見つかることもあります。勉強を兼ねて自分で調べるのものよいですが、先人たちの知恵を拝借することも同じくらい有用です。是非、手を動かしてみてください(ただし、古い情報も混じっていますので検索結果をきちんと評価しましょう)
5. Define.XML v2.1を利用する場合
Define.XML v2.1.xを利用する場合、Define.XML専用の用語集があることに注意しましょう。量は多くありませんが、「利用バージョンを決定」した上で適切な用語を選択してください。
SDTM用の用語と異なるバージョンを選択することも可能ですが、揃えておいた方が無難な気がします。
おわりに
それでは、よき一日を!