5.4.1 String encoding

Last-modified: 2025-03-21 (金) 20:43:44

5.4.1 文字列のエンコーディング

: native_bytes = unicode2native (utf8_str, codepage)

: native_bytes = unicode2native (utf8_str)
コードページを使用して、 UTF-8 文字列utf8_str をバイト ストリームに変換します。

文字ベクトルutf8_str は、 codepageで指定されたコード ページを使用してバイト ストリーム native_bytesに変換されます。文字列codepage は、有効なコード ページの識別子である必要があります。有効なコード ページの例としては、、、 または があります。サポートされているコード ページの一覧については、 https://www.gnu.org/software/libiconv を参照してください。codepage が省略されているか空の場合、 システムのデフォルトのコード ページが使用されます。 "ISO-8859-1""Shift-JIS""UTF-16"

いずれかの文字がコードページcodepageにマップできない場合は、そのコードページに適切な置換シーケンスに置き換えられます。

See also: native2unicode.

: utf8_str = native2unicode (native_bytes, codepage)

: utf8_str = native2unicode (native_bytes)

コードページを使用して、バイト ストリームnative_bytes をUTF-8 に変換します。

ベクトルnative_bytes内の数値は、0 から 255 までの整数に丸められ、切り上げられます。このバイト ストリームは、文字列codepageで指定されたコード ページにマッピングされ、文字列 utf8_strで返されます。Octave は、内部エンコーディングとして UTF-8 を使用します。文字列 codepage は、有効なコード ページの識別子でなければなりません。有効なコード ページの例としては"ISO-8859-1"、、、"Shift-JIS"または が あります"UTF-16"。サポートされているコード ページの一覧については、 https://www.gnu.org/software/libiconv を参照してください。codepage が省略されているか空の場合、システムのデフォルトのコード ページが使用されます。

native_bytesが文字列ベクトルの場合、そのまま返されます。

See also: unicode2native.