正規表現の中で先読み・後読みを使いたい

2019年12月17日 13:40

Unicodeテキストとして保存したEXCELデータから必要な情報を抽出するために、特定の文字列の直後から次に登場するタブコードの直前までの文字列を抜き出す仕組みを考えています。

var targetFile = new File("Excelから別名保存したUnicodeテキストパス");
targetFile.open("r");
var src = targetFile.read();
targetFile.close();
var re1 = new RegExp("特定の文字列\t+");
var result1 = src.match(re1);
var len = result1[0].length;
var num = result1.index + len
var result2 = src.indexOf("\t",num);
var txt = src.slice(num,result2);

上記のスクリプトで何とか目的は達することができたものの一つのUnicodeテキストから複数の情報を抽出する必要があるのでもう少し簡単な仕組みはないものかと試行錯誤しています。

抽出する情報ごとに直前の "特定の文字列" は決まっているので、特定の文字列を配列に格納して繰り返し処理していくつもりですが、なんとなく野暮ったい感じがして物足りません。

もう少し鮮やかに処理できないかなぁと思って肯定的後読みが使えないものかと思っています。
少し試しましたが上手く行かないので正規表現オブジェクトの作り方を詳しく調べてみます。

正規表現の中で先読み・後読みを使いたい

いいなと思ったら応援しよう！