6月30日(水)1コマ目
今日、やったこと 文字コード 今日のホワイトボード 文字集合と符号化方式 文字集合は文字の集まり。 符号化方式は文字を符号化(数値)に変換するルール。 扱う文字を決めて(文字集合ができる)、各文字を数値に変換するルール(符号化方式)を決めることでコンピュータで文字が扱うことができる。 規格 文字だけでなく、いろいろなところに出てくるISOとかJIS。 図 JIS、ISO エンコードとデコード 図 エンコードとデコード ASCIIで符号化 ASCIIの対応表で変換できる。 問1 '1'を符号化 図 '1'をASCIIで2進数の符号へ 問2 a*(1+b)を符号化 図 a*(1+b)をASCIIで2進数の符号へ ASCIIでの文字の並び方 数値、アルファベットは一般的な順序と同じ順になっているため、以下のプログラムでAからZまで順に出力できる。 図 ASCIIではA~Zは順に並んでいる あくまでもAからZまで順に並んでいるからできることで、もし、飛び飛びになっていたらできない。 JIS X 0201で符号化 対応表を見ると、数字、アルファベット、記号はASCIIと同じ位置。よって、符号化しても同じ。 JIS X 0201には半角アルファベットが追加されている。これは8ビット目のエリアにある。 図 JIS X 0201で半角カタカナを符号化 UNICODE 結局、国や地域ごとに使っている文字が異なるため、それぞれの国や地域ごとに文字集合が作られた。そして、各文字集合ごとに符号化方式が定められたため、文字が異なる国や地域同士で文字データのやり取りが困難(文字化けが発生する)になった。 グローバルで1つの文字集合を作ろう!で生まれたのがUNICODE。 世界中の文字を収容している(多分)。 次回は 符号化方式の話です。 テストは再来週に誤差と文字コードの内容で行います。 対策として基本情報技術者試験の誤差と文字コードに関する問題をチェックしてください。 また、このテストが情報数学の最後のテストになります。