見出し画像

CSVとExcel

会社では経理の仕事をしている。経理と言っても様々だが、大きな会社であるから、比較的余裕がある。というのも、私自身は経理全体のごく一部の業務を担当しているだけで、子会社と親会社の勘定をまとめる連結決算のような主力チームにいるわけではないからである。

経理の仕事のひとつに税務署あるいは国税庁との関わりがある。当部署の係長は毎年、各部署から上がってきたデータを集めて一定の書式に則ったかたちで国税庁に提出する業務を担当している。しかし、国税庁は電子化を進めており、CSVという形式 Comma Separated Values、すなわちカンマ区切りで四角い表の形式を定めて、それを公式サイトにアップロードさせて書類を提出させることにしている。それ自体はさすがに書類を紙に手書きして持っていくよりは便利になったはずである。

ところが、このCSVというのがすこぶるExcelと相性が悪い。なぜならば、ExcelにCSVを読み込ませるとExcelが勝手にCSVを変換してしまうからである。例えば長い数字列を勝手に指数表記に変換したり、先頭のゼロ埋めを削ったりするのだ。だから、Excelで編集したCSVを保存し、国税庁のウェブサイトに読み込ませると大抵エラーが出てくる。そのエラーもせめて何行目でエラーになったかわかればいいのだが、単に「フォーマットがだめ」という表示が出るだけで何行目に問題があるのか、何行目で読み込みがコケたのか教えてくれないという不親切さだ。一応「フォーマットがだめ」を乗り越えれば初めて、表として認識された上で何行何列に何のエラーが出たかリスト表示されるのだが、そこに至るまでが長い。国税庁の人も大変なのだろうが、同時にお役所仕事の一端を感じて実に腹立たしい。

係長はどのような書類を提出すればよいかについては長年の経験があるが、CSVのそういったメカニズムを憶えているわけではないので、一応元ITエンジニアである深草がサポートするという役目を仰せつかっている。

今日は「フォーマットがだめ」をどうやって乗り越えるかということで試行錯誤した結果、(1)一部のカラムで数字列が指数表記(=電卓で大きな数が出てくるとE+何とかって出るやつ)にすり替わっていたこと、(2)令和05年が"05"と入っていなければならないのに、エクセルで開くと"05"が"5"に削られてしまうこと、そして、(3)そもそも全角の文字列(エクセル関数をあらかじめ噛ませて仮に半角があってもすべて全角に直したはずなのだが)の中に半角カンマが多数混在していることを突き止めた。

これらのことをExcelで修正しようとすると保存する前に必ず変換された書式をすべて戻してから保存しないといけないし、さらにそれをメモ帳などのテキストエディタで確認することが必要となる。正直、Excelを使うことを放棄してテキストエディタで最初からやった方がマシかもしれない。あるいはCSV専用エディタが使えれば理想的だろう(係長が使いこなせるかどうかはまた別の話だ)。しかし、メモ帳ではないリッチなテキストエディタはインストール申請を通さないとIT部署が使わせてくれないのだ。その手続だけでも面倒である(しかも自分の手続きではなく係長の手続きをしなくてはならない)。年に一回か二回程度の作業にそこまでの労力を支払うべきか、毎回苦慮してしまう。

(1,396字、2024.01.18)

いいなと思ったら応援しよう!