Skip to content

Commit

Permalink
fix
Browse files Browse the repository at this point in the history
  • Loading branch information
yangj1211 committed Nov 25, 2024
1 parent 109acd1 commit 4f0d62a
Showing 1 changed file with 1 addition and 1 deletion.
2 changes: 1 addition & 1 deletion docs/MatrixOne/Reference/Data-Types/datalink-type.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,7 +29,7 @@ INSERT INTO TABLE_NAME VALUES ('<file://<path>/<filename>>|<stage://<stage_name>

如果要读 `DATALINK` 指向文件链接的数据,可以使用 [load_file](../../Reference/Functions-and-Operators/Other/load_file.md) 函数。
!!! note
由于 UTF-8 编码中,中文字符通常占用 3 个字节,而英文字符只占用 1 个字节。因此,在指定文件的偏移量(offset)和读取大小(size)时,如果不考虑字符的字节数对齐,可能会导致中文字符被截断或无法正确读取,从而出现乱码。为了避免这种情况,需要根据字符编码正确换算 offset 和 size 的值,确保读取内容的字节数与字符的边界对齐
`load_file()` 函数以二进制模式读取文件,对于非文本文件(如图像、音频、视频等二进制格式文件),读取的内容将以原始字节流的形式返回,不会进行字符编码的转换。此外,由于在 UTF-8 编码中,中文字符通常占用 3 个字节,而英文字符只占用 1 个字节。因此,在指定文件的偏移量(offset)和读取大小(size)时,如果不考虑字符的字节数对齐,可能会导致中文字符被截断或无法正确读取,从而出现乱码。为了避免这种情况,需要根据字符编码正确换算 offset 和 size 的值,确保读取内容的字节数与字符的边界对齐

## 示例

Expand Down

0 comments on commit 4f0d62a

Please sign in to comment.