From 4f0d62a5694c68431729787bbc463ba59ff9deac Mon Sep 17 00:00:00 2001 From: yangj1211 Date: Mon, 25 Nov 2024 10:04:08 +0800 Subject: [PATCH] fix --- docs/MatrixOne/Reference/Data-Types/datalink-type.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/MatrixOne/Reference/Data-Types/datalink-type.md b/docs/MatrixOne/Reference/Data-Types/datalink-type.md index 4c1aa8b2a8..2243180b2b 100644 --- a/docs/MatrixOne/Reference/Data-Types/datalink-type.md +++ b/docs/MatrixOne/Reference/Data-Types/datalink-type.md @@ -29,7 +29,7 @@ INSERT INTO TABLE_NAME VALUES ('/>| 如果要读 `DATALINK` 指向文件链接的数据,可以使用 [load_file](../../Reference/Functions-and-Operators/Other/load_file.md) 函数。 !!! note - 由于 UTF-8 编码中,中文字符通常占用 3 个字节,而英文字符只占用 1 个字节。因此,在指定文件的偏移量(offset)和读取大小(size)时,如果不考虑字符的字节数对齐,可能会导致中文字符被截断或无法正确读取,从而出现乱码。为了避免这种情况,需要根据字符编码正确换算 offset 和 size 的值,确保读取内容的字节数与字符的边界对齐 + `load_file()` 函数以二进制模式读取文件,对于非文本文件(如图像、音频、视频等二进制格式文件),读取的内容将以原始字节流的形式返回,不会进行字符编码的转换。此外,由于在 UTF-8 编码中,中文字符通常占用 3 个字节,而英文字符只占用 1 个字节。因此,在指定文件的偏移量(offset)和读取大小(size)时,如果不考虑字符的字节数对齐,可能会导致中文字符被截断或无法正确读取,从而出现乱码。为了避免这种情况,需要根据字符编码正确换算 offset 和 size 的值,确保读取内容的字节数与字符的边界对齐。 ## 示例