「unicode」カテゴリーアーカイブ

MySQLと「令和」 – @tmtms のメモ

MySQLと「令和」 - @tmtms のメモ

MySQLと「令和」 - @tmtms のメモ

新元号が「令和」に決まったことなので、MySQLでの扱いについての話を。 普通の文字 「令」も「和」もJIS第一水準に含まれている基本的な文字なので普通に日本語が使用できるcharsetで使用できます。 mysql> create table t ( utf8mb4 varchar(255) charset utf8mb4, utf8mb3 varchar(255) charset utf8mb3, utf16 varch...

はてなブックマーク - MySQLと「令和」 - @tmtms のメモ はてなブックマークに追加

MySQLと「令和」 – @tmtms のメモ

MySQLと「令和」 - @tmtms のメモ

MySQLと「令和」 - @tmtms のメモ

新元号が「令和」に決まったことなので、MySQLでの扱いについての話を。 普通の文字 「令」も「和」もJIS第一水準に含まれている基本的な文字なので普通に日本語が使用できるcharsetで使用できます。 mysql> create table t ( utf8mb4 varchar(255) charset utf8mb4, utf8mb3 varchar(255) charset utf8mb3, utf16 varch...

はてなブックマーク - MySQLと「令和」 - @tmtms のメモ はてなブックマークに追加

新元号「令和」と文字コード(主にUnicode)の問題 – Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

年号扱うシステムを運用しているところは、これから30日でテスト完了させなきゃいけないわけだけど、U+F9A8 U+548C (令和) のケースと、U+4EE4 U+548C (令和) のケースがあるみたいなのを想定していなかった…って事例はなんかすごくありそう。大丈夫かなぁ…

はてなブックマーク - 新元号「令和」と文字コード(主にUnicode)の問題 - Togetter はてなブックマークに追加

新元号「令和」と文字コード(主にUnicode)の問題 – Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

年号扱うシステムを運用しているところは、これから30日でテスト完了させなきゃいけないわけだけど、U+F9A8 U+548C (令和) のケースと、U+4EE4 U+548C (令和) のケースがあるみたいなのを想定していなかった…って事例はなんかすごくありそう。大丈夫かなぁ…

はてなブックマーク - 新元号「令和」と文字コード(主にUnicode)の問題 - Togetter はてなブックマークに追加

新元号「令和」と文字コード(主にUnicode)の問題 – Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

年号扱うシステムを運用しているところは、これから30日でテスト完了させなきゃいけないわけだけど、U+F9A8 U+548C (令和) のケースと、U+4EE4 U+548C (令和) のケースがあるみたいなのを想定していなかった…って事例はなんかすごくありそう。大丈夫かなぁ…

はてなブックマーク - 新元号「令和」と文字コード(主にUnicode)の問題 - Togetter はてなブックマークに追加

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12では4つの言語(script)、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。 追加された文字には日本語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています(通常の大きさの文字は以前からありまし...

はてなブックマーク - Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey はてなブックマークに追加

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey

Unicode 12では4つの言語(script)、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。 追加された文字には日本語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています(通常の大きさの文字は以前からありまし...

はてなブックマーク - Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加 - Publickey はてなブックマークに追加

C++標準化委員会、ついに文字とは何かを理解する: char8_t – Qiita

C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita

C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita

C++ Advent Calendar 2018 この記事はC++ Advent Calendar 2018 15日目の記事です。 14日目: VTKライブラリ 16日目: C++のエラー処理との付き合い方 当初見積もりよりも大幅に長い記事となり、投稿したのは12/22で1週間遅刻です。すみません。 Caution この文章には以下の要素が含まれます。苦手な方はご注意くださいね...

はてなブックマーク - C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita はてなブックマークに追加

漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館

漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館

漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館

見付かる地域差 地域性を帯びた文字を方言文字あるいは地域文字,それが漢字であれば方言漢字とも呼びます。中国は国土が広く,方言差も激しいため,古くから各地で方言漢字が作られ,用いられてきました。 日本列島では,北海道から沖縄まで各地に存在しています。奈良時代以前より,金石文,木簡,文書や書籍では使用...

はてなブックマーク - 漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館 はてなブックマークに追加

Ctrl-[ が Esc になる理由 – Humanity

Ctrl-[ が Esc になる理由 - Humanity

Ctrl-[ が Esc になる理由 - Humanity

理由 SHIFT キーはキーコードを -0x20、CTRL キーはキーコードを -0x40 する機能 全文 vim-jp.slack.com の #random から。 heavenshell [10:08 AM] TouchBar MBP にしたら強制的に C-[ になるので、オススメです!ようやく矯正できた。 mattn [10:09 AM] 人間の方が最適化されている yoshitia [10:12 AM] Escが物理的に...

はてなブックマーク - Ctrl-[ が Esc になる理由 - Humanity はてなブックマークに追加

Ctrl-[ が Esc になる理由 – Humanity

Ctrl-[ が Esc になる理由 - Humanity

Ctrl-[ が Esc になる理由 - Humanity

理由 SHIFT キーはキーコードを -0x20、CTRL キーはキーコードを -0x40 する機能 全文 vim-jp.slack.com の #random から。 heavenshell [10:08 AM] TouchBar MBP にしたら強制的に C-[ になるので、オススメです!ようやく矯正できた。 mattn [10:09 AM] 人間の方が最適化されている yoshitia [10:12 AM] Escが物理的に...

はてなブックマーク - Ctrl-[ が Esc になる理由 - Humanity はてなブックマークに追加

ぼくたちのかんがえたさいきょうのi18n国家

ぼくたちのかんがえたさいきょうのi18n国家

ぼくたちのかんがえたさいきょうのi18n国家

本記事は下記のtweetから始まるスレッドに触発され、アイディアを拝借して書いた。 i18n力が最強の国は国内に複数の言語があり、そのうちいくつかは他国でも使われている言語の方言で、1バイト文字での代替表記が困難で、歴史的にISO-2022ベースの文字コードとUnicodeと独自エンコーディングが混在していて、フリガナな...

はてなブックマーク - ぼくたちのかんがえたさいきょうのi18n国家 はてなブックマークに追加

ぼくたちのかんがえたさいきょうのi18n国家

ぼくたちのかんがえたさいきょうのi18n国家

ぼくたちのかんがえたさいきょうのi18n国家

本記事は下記のtweetから始まるスレッドに触発され、アイディアを拝借して書いた。 i18n力が最強の国は国内に複数の言語があり、そのうちいくつかは他国でも使われている言語の方言で、1バイト文字での代替表記が困難で、歴史的にISO-2022ベースの文字コードとUnicodeと独自エンコーディングが混在していて、フリガナな...

はてなブックマーク - ぼくたちのかんがえたさいきょうのi18n国家 はてなブックマークに追加

ㇹ゚ン゚’ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ(現在に至るまでの文字コードの軌跡と簡単な使い方について) – へっぽこびんぼう野郎のnewbie日記

ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ(現在に至るまでの文字コードの軌跡と簡単な使い方について) - へっぽこびんぼう野郎のnewbie日記

ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ(現在に至るまでの文字コードの軌跡と簡単な使い方について) - へっぽこびんぼう野郎のnewbie日記

はじめに 社内の勉強会で発表した文字コードの話の焼き直しです。ところどころ適当なので話半分に読んでもらえると助かります。 これ以上闇の深さを知りたくないと思って、深淵に辿り着く前に文字コードの勉強を打ち切っています。文字コードの専門家でもないので雑です。 調査が甘いので間違ってることも多々あるかもし...

はてなブックマーク - ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ(現在に至るまでの文字コードの軌跡と簡単な使い方について) - へっぽこびんぼう野郎のnewbie日記 はてなブックマークに追加