6月30日(水)1コマ目

今日、やったこと

文字コード

今日のホワイトボード

文字集合と符号化方式

文字集合は文字の集まり。

符号化方式は文字を符号化(数値)に変換するルール。

扱う文字を決めて(文字集合ができる)、各文字を数値に変換するルール(符号化方式)を決めることでコンピュータで文字が扱うことができる。

規格

文字だけでなく、いろいろなところに出てくるISOとかJIS。

図 JIS、ISO


エンコードとデコード

図 エンコードとデコード


ASCIIで符号化

ASCIIの対応表で変換できる。


問1 '1'を符号化

図 '1'をASCIIで2進数の符号へ


問2 a*(1+b)を符号化

図 a*(1+b)をASCIIで2進数の符号へ


ASCIIでの文字の並び方

数値、アルファベットは一般的な順序と同じ順になっているため、以下のプログラムでAからZまで順に出力できる。

図 ASCIIではA~Zは順に並んでいる


あくまでもAからZまで順に並んでいるからできることで、もし、飛び飛びになっていたらできない。


JIS X 0201で符号化

対応表を見ると、数字、アルファベット、記号はASCIIと同じ位置。よって、符号化しても同じ。

JIS X 0201には半角アルファベットが追加されている。これは8ビット目のエリアにある。

図 JIS X 0201で半角カタカナを符号化


UNICODE

結局、国や地域ごとに使っている文字が異なるため、それぞれの国や地域ごとに文字集合が作られた。そして、各文字集合ごとに符号化方式が定められたため、文字が異なる国や地域同士で文字データのやり取りが困難(文字化けが発生する)になった。

グローバルで1つの文字集合を作ろう!で生まれたのがUNICODE。

世界中の文字を収容している(多分)。


次回は

符号化方式の話です。

テストは再来週に誤差と文字コードの内容で行います。

対策として基本情報技術者試験の誤差と文字コードに関する問題をチェックしてください。

また、このテストが情報数学の最後のテストになります。


 

コメント

このブログの人気の投稿

5月19日(水)1コマ目

4月22日(木)1コマ目

6月23日(水)1コマ目