![見出し画像](https://assets.st-note.com/production/uploads/images/159185429/rectangle_large_type_2_47d9ecf3f72d2aa39403ce8bd30cad82.png?width=1200)
文字列置換カード (Ver.3.5.5)
時系列データ分析ツール Node-AI プロダクトマネージャーの切通です。
社内での全体合宿などもあったので、やや変則的ですが今週は3/22にNode-AIはアップデートをしております。
今回のアップデートでは、文字列の変換を行う文字列置換カードが誕生しています。北京のPM2.5のデータを元に解説します。
![](https://assets.st-note.com/img/1711243557958-qYL3QRoUXJ.png?width=1200)
Node-AIでは以前のバージョンアップで搭載されたプロパティ機能(データにどんな前処理か教えてくれる機能)でも文字列が何個あるか指摘できるようになっています。今回用いるデータでは文字列のカラムが一つ存在しているようです。データの方を見るとcbwd(風向き)という項目が「string」と書いている通り文字列になっています。
今回はこれに文字列置換をつなげて数値に変換してみます。
![](https://assets.st-note.com/img/1711244005798-CpzLWQP3zC.png?width=1200)
使い方は非常に簡単で、文字列置換カードをドラッグ&ドロップでキャンバス状に配置し、データに文字列置換をつなげるだけです。
この状態で文字列置換カードを開いて検索する文字列の入力枠をクリックすると以下のようになります。
![](https://assets.st-note.com/img/1711244120542-lmIEU5tLyP.png?width=1200)
「検索する文字列」をクリックすれば、データ内の文字を自動的に推薦してくれます。あとはこれらをそれぞれ数値に変換するだけです。
数値への変換の仕方ですが、さまざまな手法があります。マニュアルに詳しく書いてありますが、ざっくり説明するとよく使うのは2つです。
順序尺度
各商品の売り上げランキング(1位、2位、…)や、文字で表された程度の値(低、中、高)のような順序が存在する文字列に対して、0、1、2といった変換を行います。
名義尺度
原材料(材料A、材料B、…)のような順番がない文字列に対して意味の違いを表すために0、1、2といった数字を与えます。ただし、この場合はOne-hot Encodingと呼ばれる手法の方が良い場合もあります(こちらは今後Node-AIに搭載予定です)
今回のカラムは風向きです。順番は特にないとも考えられるので、名義尺度を採用します。
※ただし、風向きを北から0,1,2などの順番に置き換えるといった解釈もありです。
![](https://assets.st-note.com/img/1711244762670-4WBpYpxEum.png?width=1200)
上記の通り入力し、実行を押すと文字列が変換されます。右のプロパティを見ると、文字列が0件になっていて、全て変換されたことがわかります。実際のデータの中身も見てみると…
![](https://assets.st-note.com/img/1711244817904-jLBvEgZZ20.png?width=1200)
これで変換できました!
今回はこれ以外にもいくつかのバグも改修していますので、より快適になっていると思います。
Node-AI開発チームは3/25の週に開発合宿に行ってきて、集中開発をしてきます。
開発者発案の他のツールにはない一風変わった機能が搭載されるかもしれません!?
乞うご期待ください!