四十三庵

蔀の雑記帳

Mac OS 10.14(Mojave)でe-Tax使った体験談2019

確定申告の記事以外書いたことがないことで有名な四十三庵の確定申告記事2019です。

過去記事

blog.stm43.com

遂にe-Taxを導入

上の2015年の記事でも、紙の書類に手書きで郵送というストロングスタイルを貫いてきたんだけど、
今年からスマホで確定申告ができる! と聞いて、そろそろ手書きにこだわるのやめようかと思うようになった。
www.nta.go.jp
すばらしいですね。
さて、対象機種は……
https://www.jpki.go.jp/prepare/pdf/nfclist.pdf

AQUOS EVER SH-02J SH-02J
AQUOS R SH-03J SH-03J
AQUOS sense SH-01K SH-01K
AQUOS R2 SH-03k SH-03K
AQUOS sense2 SH-01L SH-01L
AQUOS U SHV37 SHV37
AQUOS SERIE mini SHV38 SHV38
AQUOS R SHV39 SHV39
AQUOS sense SHV40 SHV40
AQUOS R compact SHV41 SHV41
AQUOS R2 SHV42 SHV42
AQUOS sense2 SHV43 SHV43
AQUOS Xx3 mini 603SH
AQUOS ea 606SH 606SH
AQUOS R 605SH 605SH
AQUOS R compact 701SH 701SH
AQUOS R2 706SH 706SH
AQUOS zero 801SH 801SH
AQUOS R2 compact 803SH 803SH
AQUOS L SHV37 SHV37
AQUOS L2 SH-L02 SH-L02
AQUOS sense SHV40
AQUOS sense2 SHV43 SHV43
AQUOS L2 SH-L02 SH-L02 J:COM
Android One X1 X1
Android One X4 X4-SH
AQUOS SH-M04 SH-M04
AQUOS sense lite SH-M05 SH-M05
AQUOS R compact SH-M06 SH-M06
AQUOS sense plus SH-M07 SH-M07
AQUOS sense2 SH-M08 SH-M08
AQUOS R2 compact SH-M09 SH-M09
arrows NX F-01J F-01J
らくらくスマートフォン4 F-04J F-04J
arrows Be F-05J F-05J
arrows NX F-01K F-01K
arrows Tab F-02K(タブレット端末) F-02K
らくらくスマートフォン me F-03K F-03K
arrows Be F-04K F-04K
らくらくスマートフォン me F-01L F-01L
Xperia XZ1 SO-01K SO-01K
Xperia XZ1 Compact SO-02K SO-02K
Xperia XZ2 SO-03K SO-03K
Xperia XZ2 Compact SO-05K SO-05K
Xperia XZ2 Premium SO-04K SO-04K
Xperia XZ3 SO-01L SO-01L
Xperia XZ1 SOV36 SOV36
Xperia XZ2 SOV37 SOV37
Xperia XZ2 Premium SOV38 SOV38
Xperia XZ3 SOV39 SOV39
Xperia XZ1 701SO 701SO
Xperia XZ2 702SO 702SO
Xperia XZ3 801SO 801SO
Galaxy S9 SC-02K SC-02K
Galaxy S9+ SC-03K SC-03K
Galaxy Note9 SC-01L SC-01L
Galaxy Feel2 SC-02L SC-02L
Galaxy S9 SCV38 SCV38
Galaxy S9+ SCV39 SCV39
Galaxy Note9 SCV40 SCV40
NuAns NEO [Reloaded] NuAns NEO [Reloaded]
URBANO V04 KYV45

あ、Andoroid限定〜〜〜〜〜〜〜〜〜〜〜〜〜
てか日本のIT企業の利権〜〜〜〜〜〜〜〜〜〜〜〜〜
らくらくスマホ入ってる〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜

いろいろつっこみどころのあるチョイスではあるものの、日本政府のIT施策はこんなレベルでしょう。
一瞬確定申告のためだけにGalaxyかXperia買おうかな?とも思ったのですが、
普通にメルカリでも10万前後なので、そのぐらいならもうICカードリーダライタ買っちゃおうと思うに至った。


Amazonでこれを買った。
特に何がよかったわけではなくて、単に安かったのと、Macでも使えたというレビューがあったので。
あと1〜2年待てば普通にiPhoneでマイナンバーカード読める気するけど、
まあ1000円ちょいならいいでしょうということで購入。

Safariじゃないとダメ

ICカードリーダライタという確実に年に一度しか使わない機器が届いて、さっそくe-Taxを試した。
まずGoogle Chromeだとe-Taxは使えない。
WindowsならIE、MacならSafariが標準ブラウザ。
WindowsのIE縛りはさすがに叩かれまくったのか、Microsoft Edge 42/Firefox 63 /Google Chrome 70でも可能。
ただMacはSafari縛り。Google Chromeだと処理を進ませないようになっている。
この時点でちょっとウッって感じにはなるが、がんばって進めていく。
(たぶんMacのテストはそんな工数積まなかったのだろう)

変なアプリ入れさせる

基本的には税務署のガイダンスに従ってやっていくだけになる。

www.keisan.nta.go.jp
詳しい解説をする気はないが、このガイダンスに従うと、
Macだと謎のアプリ三兄弟を入れることになる。

f:id:st43:20190305000820p:plain
なにこれ
ちょっとマジでなぜこれを入れさせられたのかはよくわからないが、とにかくこれがないとe-Taxが使えないので、回避策はない。
アイコンがダサいとかはもう百歩譲っていいとして、
せめて1つにできなかったのかとか思ったけど、先に進む。

マイナンバーカードの認証

なんか去年まで? はマイナンバーカードを使わせていただくための申請を役所に出しに行く必要があったらしい? のだが、
今年からなくなったらしく、機械さえそろっていれば特に特別なことはなく、
ダサいアプリ三つ入れるとマイナンバーカードの認証ができる。
最初ちょっとドキドキしたが、案外すんなり行った。
役所でマイナンバーカード発行するとき、なんか3つくらいパスワード書かされたのが気になっていたが、
その中の2つのパスワードを入れることになった。
3回だか5回だかミスると失効する。
幸い僕は大丈夫だったが、失効したらどうなるんだ……?

入力を中断したかったら.dataファイルでセーブ可能

途中で確定申告書書くのを中断したかったら、.dataファイルというのを作って、再開可能。
サーバ側で保持はしないっぽい。
まあセーブ可能なのは便利だけど、ファイルの扱いとかジジババはちょっと難しいだろうから、不親切じゃないのと思ったり。

最初の画面

無事ICカードを認証すると、最初の画面がこれ。

f:id:st43:20190305002140p:plain
左のボタン選択が お分かりにならない方

一番右を選ぶと、なんか「猿でもできる確定申告モード」みたいなのに誘導されるらしい。
ちょっとおもしろい。
一番左は給料or年金専用の人で、結構親切な誘導がある。
雑所得とか寄附金控除とか使いたい人は真ん中。

で、いろいろ入力していくと……

いろいろ入力すると、この画面に行った。

f:id:st43:20190305003118p:plain
ドン!
これなにがすごいって、紙の帳票の仕様をそのままWEBに移植してるんですよね……

僕ももう子供じゃないので、日本政府にイケてるUIを提供しろなんて思わないですが、
なんていうか、すごいですよね。。。
そらブラウザ変えられただけでレイアウト全部崩れるし、動かなかったりするわ、という。

ただ使い勝手は……?

この画面に来て満足して2週間くらい放置していたのですが、
いい加減締切が近づいてきたので、重い腰をあげて入力し始めました。
すると……マジで感動しました。
3年間手書きで申請書書いてきて、ほぼ前年と数字変えるだけの作業にまで落としていたけど、それでも半日はかかる作業だった。
しかも半日かけて出した数字が間違っていて、訂正申告させられた年が2回あった。
去年ようやく一発で通った。
e-Taxの導入のおかげで、ものの3時間程度で確定申告が完了した。
たぶん要領をつかめば、1時間ちょいでできるだろう。
何がいいって、自分で電卓使って計算していたところを、自動計算してくれるところだ。
復興特別所得税額の計算とかかなりしんどかった。

そしてこれはずっと勘違いしていたけど、
e-Tax使っても源泉徴収票とかその辺は郵送しないとダメと思っていたら、なんと免除されるらしい。
www.e-tax.nta.go.jp

平成20年1月4日以後に、平成19年分以後の所得税の確定申告書の提出をe-Taxを利用して行う場合、次に掲げる第三者作成書類については、その記載内容を入力して送信することにより、これらの書類の税務署への提出又は提示を省略することができます。

(対象となる第三者作成書類)
 給与所得、退職所得及び公的年金等の源泉徴収票

え、じゃあていうかなんで紙で郵送してたときは原本添付させてたの?という素朴な疑問はあるが、これはマジで嬉しい。

まとめ

序盤はe-TaxをDisっていたけど、後半で普通に感動した話でした。
来年はiPhoneでできるようになってるといいな。
(了)

なぜ日本がデータ分析で成果を出せないかをシステムの観点から説明する

このブログの昔からの読者ならご存知だと思いますが、
大学時代わたくしは経済学部でデータ分析をやっておりました。
最近のトレンドはまったく追ってない*1ので、
今話題のデータサイエンティストが何やってるのかわからないんですが、
最小二乗法使って回帰分析して、この変数が有意水準何%でどんぐらい効いてるね、みたいなことをやっていました。

で、大学時代データ分析やる中でよく困ったのが、分析したいがデータが公開されてない、ということでした。

「◯◯を知りたいんで、☓☓みたいなデータ探してるんですけど、いいのないっすかね?」
と教授に言うと、
「あ、それはこれとこれがあるけど、どっちもサンプル数少なすぎて参考にならないね……」
「そっすか……」

https://blog.stm43.com/entry/20140727/1406451084

特に民間企業のデータ開示は異常に対応してくれない。
個人情報ならともかく、見せて問題ないものなら、もっと見せてくれてもいいじゃないか、と思っていた。

その後就職してからは業務系システムのSEやってるんですが、
その中で、「ああ、これは確かに開示できないわな」と思うようになったので、
データ開示に対する価値観ではなく、ITシステムの制約の面から説明してみようと思います。

対象読者ですが、データ分析もシステムも前提知識がなくても読めるレベルで書くつもりなので、特にしぼるつもりはないです。

国家や企業の持っているデータは扱いづらい形式になっている

agora-web.jp
ちょっと前に話題になりましたが、勤労統計が間違っていた原因が、
雇用統計担当係の中でも1人か2人しか読めない、COBOLという言語で書かれていたプログラムだったため、
という厚生労働省の報告書がありました。

このニュース自体は単純におそまつですが、ただこの一件からもわかるとおり、
国家や企業の基幹系システムというのは、ボタンをポチポチすると、
必要なデータをきれいに一覧で出してくれる……みたいにはなっていません。
特に厚生労働省みたいなメインフレームを使ってる基幹系システムになると、かなりしんどいです。
このしんどさについて、もうちょっと説明してみようと思います。

基幹系システムは別に時系列にデータを持ちたいわけではない

データ分析したい人にとって、必要なのは、時系列データとかが多いと思います。
ところが、システム側では、時系列でデータを持っていない場合が多いです。
最新情報だけを持っており、日次でバックアップをとっているので、
そのバックアップデータを整形して、時系列データにする、というのは可能です。
可能ですが、多くのシステムは、統計をとるのを目的としていないので、結構しんどい作業になります。

更に昔のデータが欲しい、となると、経費削減のためにテープでバックアップしてあったりします。
テープとかになってくるともう絶望ですね。
僕は官公庁システムは触ったことはないですが、管理台帳はあるが、
現実的には扱いようもない、テープに入った過去データがたくさん死蔵されてる場所があるんじゃないかと想像しています。
記録媒体の進歩にあわせて、そういうバックアップを簡単に扱えるような移管作業をしていればよいのでしょうが、
政府は研究機関ではないので、何か強い理由がなければやらないでしょう。

もちろん会社の中でも、データの推移とかを見たい場合があるので、
最低限の統計処理は内部でしていると思うので、それが上手いことデータ分析者の目的と合えばいいですが、
大抵の場合はデータ分析者の要求している形式ではないと思います。

ファイルやDBから必要なデータをどう抜き出すか

システムの中では、データはファイルやDB(データベース)の中に格納されています。
Excelファイルをダウンロードする、みたいな感じでできたらいいのですが、実際はもっとカオス状態になっています。
DBというのは、サーバ上でデータを蓄積するための仕組みです。
ファイルが普通にストレージ上に保存しただけのデータなのに対して、DBはデータを整理して、格納します。
そのDBを管理しているシステム(DBMSと呼ばれます)がいて、
そいつに対して、データの格納や取り出しを依頼することで、データの一元管理を実現します。

ファイルは部屋の中に本が置かれてるだけの状態なのに対して、
DBはきちんと本棚に並んで管理されていて、司書さんに頼むと色々してくれるイメージですね。
本の数とか客の数とかが増えてくると、司書さんの仕事が回らなくなってくるので、
システムのパフォーマンスのためによく使うデータは一時的にファイルにして、そこを見に行く、みたいなこともやります。

で、ここからはシステムの設計次第ではあるんですが、
このファイルやDBは基本的にはデータ分析しやすい構成になっていることはないと思います。
なぜかというと、基本的にはシステムのパフォーマンスとか、プログラムが処理しやすい形にするだとか、
システムの観点からデータの置き方を考えます。
なので、たとえば「全国で展開しているスーパーの顧客の購買履歴データを分析したい」と思っても、
顧客情報DBと購買履歴DBはおそらく別々にある構成になっています。
だから、購買履歴DBだけを見ても「Aというお客さんが何時何分に◯◯を買った」というデータがわかるだけで、
「Aさんの性別、年齢、職業」などは顧客情報DBを見ないとわかりません。
こういう場合、二つのDBから必要な情報を結合して、出力するということができます。
「Aさん」という情報をキーにして、顧客情報DB+購買履歴DBをつくるイメージです。
ただこれをやるためには、ちょっとしたプログラミングをしないといけません。
データのありかがメインフレームじゃなければCOBOLじゃなくて、
もうちょっと楽なスクリプト言語(pythonとか)でイケるでしょうが、しんどいことには変わりありません。
メインフレームが入っていたら、COBOL書く必要がありますね。辛いですね。
そしてデータ自体が巨大だと、そのデータを整形する処理も数時間バッチ回さないといけなかったりします。
数時間ですめばまだいいですが、ヘタすると何日回しても終わらず、
途中で何か不正データなりを引いて、バッチがコケるとか、そういう展開もありえます。
そうなると、辛いとかじゃなく、インプットのデータが作れない、となってしまうので、厳しいです。

データ分析は正直分析可能なデータ形式まで落としたら、
あとは統計ソフトなり何なりに突っ込むだけなので、下ごしらえが一番大変というのはあるんですが、
基幹系システムのデータだとその下ごしらえで多大な時間と労力を要する気がします。

個人情報の扱いだとか、機密情報へのアクセス権だとか、
その手の権限の問題もあると思いますが、この手のシステムの制約のほうが、
ビッグデータだなんだとバズワードになっている中で、あまり顕著な成果が出ているように見えない要因なのではないかと思っています。

インプットがゴミだとアウトプットはゴミしかでない

どこかでデータサイエンティストの人が書いていました。
インプットがゴミだとアウトプットはゴミしかでない、と。

これは的を射た言葉だなと思っています。
と同時に、データ分析の限界を示す言葉でもあると思っています。
インプットがなければ、データ分析はそもそも不可能。

だからホントの意味でデータドリブンにビジネスを回したいんであれば、
インプット、つまり企業内の統計データ管理体制を設計する段階から、
データサイエンティストみたいな人をおいて、体制を構築しないと厳しいと思っています。

データ分析フレンドリーなシステムって作れるのか?

ここまで書いて思ったんですが、データ分析がしやすいシステム、データ分析フレンドリーなシステムってなんだろう?
recruit-tech.co.jp
テキトーにググってみたら、まあやっぱ案の定データサイエンティストの人も悩んでるみたいです。
大抵の環境で、そんなシステムはないので、データ基盤をつくるところからのスタートになるんでしょうか。
(了)

*1:思うところがあり