日本オラクルは、一橋大学が学術研究・高等教育のための公的統計ミクロデータ利用の促進の一環として、小・中・高での統計教育の推進に向けて同大学が開発した「基本統計量に基づいた度数別数値パターンデータベース」を「Oracle Autonomous Data Warehouse」で、Web上でのデータ検索環境を「Oracle Application Express(APEX)」で構築したことを、8月18日に発表した。
一橋大学は、統計センターと連携協力協定を締結し、日本の公的統計ならびに学術研究の発展および振興に寄与する活動を行っている。その1つとして、学内にオンサイト施設を設置し、公的統計ミクロデータの利用(オンサイト利用)環境の提供を行っている。
オンサイト利用では、利用者が統計調査の調査票情報を用いて探索的な研究が行えるものの、審査についてはEES Net SDCを元に総務省で策定されたガイドラインに基づいて行われる。同大学による「基本統計量に基づいた度数別数値パターン検索」の研究開発では、このガイドラインに加えて、データの持ち出しが安全か否かを平均、分散、歪度および尖度などの基本統計量を用いて判定可能かについての検証を実施している。
同研究では、1510億の基本統計量と、約2億件にもおよぶ数値パターン(無限にある実数を有限化することで得られる値)を検索し回答を得るシステムを、限られた人員、予算内で構築する必要があった。当初は、高性能ワークステーションで稼働する他社データベースでこのデータの処理と抽出を試みたものの、性能上検索結果を得ることができず、性能、運用管理およびコストの要件に合ったシステムを検討していた。
「Oracle Autonomous Data Warehouse」による検証では、これまでまったく抽出できなかったデータ検索を実行可能な性能が得られた。また、アジャイル開発基盤での迅速なUI設計・開発が可能であること、自律機能による運用管理の負担軽減、暗号化によるデータ・セキュリティといった今後の運用や外部公開におけるメリットが評価され、「Oracle Autonomous Data Warehouse」の導入が決定されている。
今回の研究開発では、「Oracle Autonomous Data Warehouse」のパーティショニング機能によって、1510億件の基本統計量を分散処理し、2TB以上のデータに圧縮機能を活用することで、最小限のリソースながら高い性能を実現した。また、「Oracle Autonomous Data Warehouse」ではデータウェアハウスを利用していないときにはコンピュートリソースをオフにできるため、仮想サーバ上にスケジューラー機能を実装、設置し、利用コストを柔軟に管理している。さらに、Web上でのデータ利用を可能にする検索環境を、ローコードでのアプリケーション開発ツール「Oracle Application Express」で開発し、公開した。
環境構築には、同社のコンサルティング部門が提供する「Rapid Start Service for Autonomous Data Warehouse Cloud 」を採用。「Oracle Autonomous Data Warehouse」へのデータロードや「Oracle Application Express」でのWebアプリケーション開発といった支援によって、約1.5か月での構築を実現している。アジャイル型の開発手法を採用することで、短期間でのパターンデータ開発およびデータ検索環境の構築が行われた。
一橋大学では、「Oracle Autonomous Data Warehouse」の採用を機に、同大学で手掛ける他のプロジェクトでも利用を開始している。
この記事は参考になりましたか?
この記事をシェア