しょぼいマシンで自作プログラミング言語を作ってみる (23)

UTF-32での字句解析にあたって(6)

コメントアウトの字句解析の改修

 上記記事のコメントアウトの仕様を以下の通りに修正しました。

  • "//"から始まるのが単行コメントです。

  • "/#"から始まるのがドキュメント自動生成用の単行コメントです。

  • "/#!"から始まるのがソースファイルの最上部に配置するドキュメント自動生成用の単行コメントです。

  • "//<"から始まり、"//>"で終わるのがブロックコメントです。

  • "/#<"から始まり、"/#>"で終わるのがドキュメント自動生成用のブロックコメントです。

  • "/#!<"から始まり、"/#>"で終わるのがソースファイルの最上部に配置するドキュメント自動生成用のブロックコメントです。

 ドキュメント自動生成用のコメントアウトについては各行の冒頭に'@'、その次に英数字の文字列が含まれる場合、英数字の文字列をドキュメントタグトークンとして扱います。'_'(アンダーライン)はドキュメントタグトークンに含みません。

 コメントアウトの末尾の'\'(バックスラッシュ)が含まれる場合の継続行扱いは取りやめました。
 行番号や列番号のカウント処理が面倒になりそうだと考えた結果です。

 とりあえず、今回の記事はここまで。継続して字句解析処理の改修を進めていきます。

いいなと思ったら応援しよう!