XBRLの中身

EDINETまたはTDnetでダウンロードできるXBRL形式のファイルを解析する。
けど構造が複雑で、ちゃんと把握できてない。

ダウンロードしたファイル

File 内容
xxx.htm 表示用テーブルを表すhtmファイル
xxx.xbrl データを持ったインスタンスファイル
xxx.xsd スキーマ
xxx_cal.xml 計算リンク
xxx_def.xml 同一性とか
xxx_lab.xml タクソノミーと表示用ラベルを関連付けるリンクファイル
xxx_lab-en.xml 英語表記の表示用ラベル
xxx_pre.xml 表示用に階層構造を示すリンクファイル
manifest.xml

だいたいこんな感じだけどEDINETとTDnetでは中身が少し違う。
TDnetではインスタンスファイルがない。
2014年ぐらいまではあったけど無くなってしまったので、それ以降はhtmファイルから取り出すしかない。
どっちの場合でもhtmファイルからインスタンス情報を読み込んでしまえば良いのかな?

APIから取得する

有報キャッチャー ウェブサービスというのがある。

ここから各ファイルを取得してくるんだけど、最低限ダウンロードしないといけないのはxsdファイルとmanifestファイルの2つ。
xsdファイルにはラベルリンクなど他のファイルの参照先が、manifestファイルにはインスタンスとなるhtmファイルが示されている。
だからもしインスタンスファイルから取得する場合はxsdファイルとxbrlファイルの2つをダウンロードする。

ファイルの命名規約

一つ例を挙げる。

EDINET

【E00763】神島化学工業株式会社 四半期報告書-第100期第3四半期(平成27年11月1日-平成28年1月31日)

0000000_header_jpcrp040300-q3r-001_E00763-000_2016-01-31_01_2016-03-10_ixbrl.htm
(7桁)_(header|honbun)_jp(crp|ctl|sps|略)(様式番号)-(q[1-5]r|asr|略)-(報告書連番)_(EDINETコード)-(追番)-(報告期間末日)-(提出回数)-(提出日)_ixbrl.html

jpcrp040300-q3r-001_E00763-000_2016-01-31_01_2016-03-10.xsd
jp(crp|ctl|sps|略)(様式番号)-(q[1-5]r|asr|略)-(報告書連番)_(EDINETコード)-(追番)-(報告期間末日)-(提出回数)-(提出日).xsd

昔の規約と現在の規約は少し違う。
詳しくは
H27年3月のガイドライン
H24年6月のガイドライン
EDINETタクソノミの設定規約書

TDnet

【40260】神島化学工業株式会社 平成28年4月期第3四半期決算短信〔日本基準〕(非連結)

0500000-anbs02-tse-anedjpfr-40260-2016-04-30-01-2016-06-10-ixbrl.htm
(7桁)-(区分)-tse-(a|s|q)(c|n)(edjp|edus|edif|略)(sm|fr|nt|qi)-(証券コード)0-(報告対象期間期末日)-(提出回数)-(提出日)-ixbrl.htm

tse-qnedjpfr-40260-2016-01-31-01-2016-03-10.xsd
tse-(a|s|q)(c|n)(edjp|edus|edif|略)(sm|fr|nt|qi)-(証券コード)0-(報告対象期間期末日)-(提出回数)-(提出日).xsd

こっちも昔と少し変わってる。
JPX:適時開示情報のXBRL化
報告書インスタンスの命名規約(TDnet)

About houzkin

Leave a comment


*