fix: remove useless content

geo-yuheng · Apr 20, 2024 · ad3b5dd · ad3b5dd
1 parent e40ca57
commit ad3b5dd
Showing 1 changed file with 15 additions and 35 deletions.
diff --git a/src/yuheng/plugin/overpass/overpass_parse.py b/src/yuheng/plugin/overpass/overpass_parse.py
@@ -1,25 +1,15 @@
-# import re
-#
-#
-# def remove_comment(query_content: str) -> str:
-#     """
-#     注释移除有新的思想，块注释和行注释是可以互不相干的操作的。行注释并非找不到后置令牌，它的后置令牌就是\n，因为换行了就不再继续注释。
-#     因此注释就变为不贪婪的匹配最小的令牌包裹的段落，其中块注释匹配/*和*/之间作为注释体，行注释匹配//和\n之间作为注释体。
-#     移除注释就是对注释体进行替换的处理（对于匹配过程是后处理，但整个移除注释对于解析过程是预处理），不过处理方式不一样。
-#     块注释是直接替换为""，行注释则是替换为"\n"以保证这一行还在（虽然对于overpass来说是比较抗折行的不给\n也行，但毕竟最小程度降低对原来信息的改动）
-#     最后，可能还需要移除完全不存在任何内容的空行。因为这些空行可能是移除了注释造成的
-#     """
-#     pattern_line_comment = r"^.*//{.*?}\n.*$"
-#     pattern_block_comment = r"^.*/\*{.*?}\*/.*$"
-#     query_content = re.findall(pattern_line_comment, query_content)
-#     return query_content
-#
-
 import re
 
 
 def remove_comment(query_content: str) -> str:
-    pattern_line_comment = r"(//.*\n)"
+    """
+    注释移除有新的思想，块注释和行注释是可以互不相干的操作的。行注释并非找不到后置令牌，它的后置令牌就是\n，因为换行了就不再继续注释。
+    因此注释就变为不贪婪的匹配最小的令牌包裹的段落，其中块注释匹配/*和*/之间作为注释体，行注释匹配//和\n之间作为注释体。
+    移除注释就是对注释体进行替换的处理（对于匹配过程是后处理，但整个移除注释对于解析过程是预处理），不过处理方式不一样。
+    块注释是直接替换为""，行注释则是替换为"\n"以保证这一行还在（虽然对于overpass来说是比较抗折行的不给\n也行，但毕竟最小程度降低对原来信息的改动）
+    最后，可能还需要移除完全不存在任何内容的空行。因为这些空行可能是移除了注释造成的
+    """
+    pattern_line_comment = r"(//.*)"
     pattern_block_comment = r"(/\*.*?\*/)"
 
     # 移除块注释（/* ... */）
@@ -29,24 +19,14 @@ def remove_comment(query_content: str) -> str:
 
     # 移除行注释（// ... \n）
     query_content = re.sub(
-        pattern_line_comment, "", query_content, flags=re.MULTILINE
+        pattern_line_comment, "\n", query_content, flags=re.MULTILINE
     )
 
-    return query_content
-
+    print(query_content)
+    print("--" * 10)
 
-# 测试代码
-query = """
-SELECT *
-Hello /*
-baabala
-*/ P！
-FROM table
-WHERE column = value
-// This is a comment
-AND another_column = another_value /* This is a block comment */
-balabala //123
-"""
+    # 移除只包含空格或制表符的行和空行
+    query_content = re.sub(r"^\s*$", "", query_content, flags=re.MULTILINE)
+    query_content = "\n".join(list(filter(bool, query_content.split("\n"))))
 
-result = remove_comment(query)
-print(result)
+    return query_content