「夏の電脳甲子園」SupercomputingContest2017の本選結果について

 第23回スーパーコンピューティングコンテストを8月21日から25日の5日間、大阪会場と東京会場に分かれて開催しました。予選参加校32校42チームの上位20チームが熱き知的な戦いを繰り広げました。
 今年は、大阪大学のスーパーコンピュータSX-ACEを使用しました。本選課題「オーディオデータを近似的に圧縮しよう」ではPCM(Pulse Code Modulation)データを1ビットのデータ列でなるべくよく近似するためにSX-ACEのベクトル化と並列化を活用して競いました。

 
【本選課題】
1 背景
 CDなどのデジタルオーディオでは、元となるアナログ信号をPCM(Pulse Code Modulation) という方式によって離散的なデジタル信号に変換する。ここでサンプリング周波数とビット深度という概念を説明しよう。サンプリング周波数とはアナログ信号を一定時間間隔ごとに数値データ化するその時間間隔の逆数である。たとえばCDではサンプリング周波数が44100Hz だが、これは元のアナログ信号を1秒間に44100回数値データ化していることを意味している。ビット深度は本来連続値である音量データを何ビットの整数で表現するかを表す。CD では16 ビットである。これは音の最大値と最小値の間を216 に分割することを意味している(つまり、音の大きさは-32768 から+32767 までの整数で表現され、無音が0である)。以下の問題ではCD と同じサンプリング周波数44100Hz、ビット深度16ビットのPCM データを扱おう。つまり、1秒間の音のデータは44100 個の16 ビット整数で表現される。
 さて、PCM データをさらに圧縮することを考えたい。そこでここではビット深度の代わりに信号の変化を「前の時刻に比べて数値が増えるか減るか」の1ビット情報で表すことを考えてみよう。元のサンプリング周波数よりも充分に細かい時間分解能でこれを行うと、元のPCM データをほぼ完全に再現できる。実際にこれは一部のデジタル・オーディオ・アンプで使われている方法である。しかし、ここではデータ圧縮を目的として、時間間隔はCD と同じままとする。この場合、データ量は1/16 に減る代わりに、元のPCM データを完全には再現できないことは明らかである。このように完全には元のデータを再現できないデータ圧縮法を「不可逆圧縮」と呼ぶ。
 今回の目的は、与えられたPCM データを上で説明した1ビットのデータ列でなるべくよく近似することである。元のPCM データをもとに、数値を増やすときは1、減らす時は0となる1ビットの数列を生成する。これを「エンコード」(符号化) と呼ぼう。増減の1ステップがどれだけの数値変化に対応するかは自由に決めるが、この数値はデータ全体を通して固定である。
 近似の「よさ」の判断基準が必要である。そのためにエンコードされた1ビット・データ列から音のデータに変換する。これを「デコード」(復号) と呼ぼう。単純にデコードしただけでは、元データに比べてぎざぎざしたものが得られるのは明らかだろう。これは「高周波ノイズ」として音に影響する。そこで、デコードに際しては「平滑化」を行うことにする。つまり、適当な時間幅で音量を平均してしまうのである。これは高周波をカットする「ローパスフィルター」の一種である。近似のよさを評価するために、デコードされた音と元のPCM の音の両方を平滑化し、ふたつの「同時刻での差の絶対値」を全時刻に渡って足したものが小さければ小さいほどよいものとしよう。

     
    【本選結果】
    8月25日に表彰式を行い、上位3チームに表彰状とメダルが授与されました。
     
    優勝
    solars   北九州工業高等専門学校
     
    準優勝
    KMiBa    筑波大学附属駒場高等学校
     
    準優勝
    WayKey   静岡県立浜松工業高等学校

     

    小川情報担当理事挨拶

    小川情報担当理事挨拶


    優勝チーム(solars)へメダル授与

    優勝チーム(solars)へメダル授与


    大阪会場

    大阪会場


    東京会場

    東京会場


      公開日:2017年09月12日
      カテゴリー:一般の方