kontur-courses · mineevmaxim · Nov 25, 2024 · Nov 29, 2024 · Dec 1, 2024 · Dec 2, 2024
diff --git a/.gitignore b/.gitignore
@@ -239,3 +239,4 @@ _Pvt_Extensions
 **/.idea
 **/.vscode
 **/node_modules
+/cs/Markdown/Markdown.csproj.DotSettings
diff --git a/cs/Markdown/AstNodes/BoldMarkdownNode.cs b/cs/Markdown/AstNodes/BoldMarkdownNode.cs
@@ -0,0 +1,9 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public class BoldMarkdownNode : MarkdownNode, IMarkdownNodeWithChildren
+{
+    public override MarkdownNodeName Type => MarkdownNodeName.Bold;
+    public List<MarkdownNode> Children { get; } = [];
+}
diff --git a/cs/Markdown/AstNodes/HeadingMarkdownNode.cs b/cs/Markdown/AstNodes/HeadingMarkdownNode.cs
@@ -0,0 +1,9 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public class HeadingMarkdownNode : MarkdownNode, IMarkdownNodeWithChildren
+{
+    public override MarkdownNodeName Type => MarkdownNodeName.Heading;
+    public List<MarkdownNode> Children { get; } = [];
+}
diff --git a/cs/Markdown/AstNodes/IMarkdownNodeWithChildren.cs b/cs/Markdown/AstNodes/IMarkdownNodeWithChildren.cs
@@ -0,0 +1,6 @@
+namespace Markdown.AstNodes;
+
+public interface IMarkdownNodeWithChildren
+{
+    public List<MarkdownNode> Children { get; }
+}
diff --git a/cs/Markdown/AstNodes/ItalicMarkdownNode.cs b/cs/Markdown/AstNodes/ItalicMarkdownNode.cs
@@ -0,0 +1,9 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public class ItalicMarkdownNode : MarkdownNode, IMarkdownNodeWithChildren
+{
+    public override MarkdownNodeName Type => MarkdownNodeName.Italic;
+    public List<MarkdownNode> Children { get; } = [];
+}
diff --git a/cs/Markdown/AstNodes/MarkdownNode.cs b/cs/Markdown/AstNodes/MarkdownNode.cs
@@ -0,0 +1,17 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public abstract class MarkdownNode
+{
+    public abstract MarkdownNodeName Type { get; }
+
+    public override bool Equals(object? obj)
+    {
+        if (this is IMarkdownNodeWithChildren node && obj is IMarkdownNodeWithChildren other)
+            return this.GetType() == other.GetType() && node.Children.SequenceEqual(other.Children);
+        if (this is TextMarkdownNode valueNode && obj is TextMarkdownNode otherValueNode)
+            return valueNode.Content.Equals(otherValueNode.Content);
+        return false;
+    }
+}
diff --git a/cs/Markdown/AstNodes/RootMarkdownNode.cs b/cs/Markdown/AstNodes/RootMarkdownNode.cs
@@ -0,0 +1,9 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public class RootMarkdownNode : MarkdownNode, IMarkdownNodeWithChildren
+{
+    public override MarkdownNodeName Type => MarkdownNodeName.Root;
+    public List<MarkdownNode> Children { get; } = [];
+}
diff --git a/cs/Markdown/AstNodes/TextMarkdownNode.cs b/cs/Markdown/AstNodes/TextMarkdownNode.cs
@@ -0,0 +1,9 @@
+using Markdown.Enums;
+
+namespace Markdown.AstNodes;
+
+public class TextMarkdownNode(string content) : MarkdownNode
+{
+    public override MarkdownNodeName Type => MarkdownNodeName.Text;
+    public string Content => content;
+}
diff --git a/cs/Markdown/Enums/MarkdownNodeName.cs b/cs/Markdown/Enums/MarkdownNodeName.cs
@@ -0,0 +1,10 @@
+namespace Markdown.Enums;
+
+public enum MarkdownNodeName
+{
+    Bold,
+    Italic,
+    Heading,
+    Text,
+    Root,
+}
diff --git a/cs/Markdown/Enums/MarkdownTokenName.cs b/cs/Markdown/Enums/MarkdownTokenName.cs
@@ -0,0 +1,12 @@
+namespace Markdown.Enums;
+
+public enum MarkdownTokenName
+{
+    Italic,
+    Bold,
+    Heading,
+    Text,
+    NewLine,
+    Space,
+    Number,
+}
diff --git a/cs/Markdown/Interfaces/ILexer.cs b/cs/Markdown/Interfaces/ILexer.cs
@@ -0,0 +1,8 @@
+using Markdown.Tokens;
+
+namespace Markdown;
+
+public interface ILexer
+{
+    List<Token> Tokenize(string input);
+}
diff --git a/cs/Markdown/Interfaces/IParser.cs b/cs/Markdown/Interfaces/IParser.cs
@@ -0,0 +1,9 @@
+using Markdown.AstNodes;
+using Markdown.Tokens;
+
+namespace Markdown;
+
+public interface IParser
+{
+    RootMarkdownNode Parse(List<Token> tokens);
+}
diff --git a/cs/Markdown/Markdown.csproj b/cs/Markdown/Markdown.csproj
@@ -0,0 +1,9 @@
+<Project Sdk="Microsoft.NET.Sdk">
+
+    <PropertyGroup>
+        <TargetFramework>net8.0</TargetFramework>
+        <ImplicitUsings>enable</ImplicitUsings>
+        <Nullable>enable</Nullable>
+    </PropertyGroup>
+
+</Project>
diff --git a/cs/Markdown/MarkdownLexer.cs b/cs/Markdown/MarkdownLexer.cs
@@ -0,0 +1,208 @@
+using System.Text;
+using Markdown.Tokens;
+
+namespace Markdown;
+
+public class MarkdownLexer : ILexer
+{
+    private int position;
+    private readonly List<Token> tokens = [];
+
+    private readonly char[] escapedChars =
+    [
+        MarkdownSymbols.SharpChar, MarkdownSymbols.GroundChar, MarkdownSymbols.EscapeChar, MarkdownSymbols.NewLineChar
+    ];
+
+    public List<Token> Tokenize(string input) => Tokenize(new MarkdownLexerInput(input));
+
+    private List<Token> Tokenize(MarkdownLexerInput input)
+    {
+        position = 0;
+        var nestingStack = new Stack<string>();
+
+        while (position < input.Length)
+        {
+            switch (input[position])
+            {
+                case MarkdownSymbols.SpaceChar:
+                    ParseSpaceAndAdvance();
+                    break;
+                case MarkdownSymbols.NewLineChar:
+                    ParseNewLineAndAdvance(nestingStack);
+                    break;
+                case MarkdownSymbols.EscapeChar:
+                    ParseEscapeAndAdvance(input);
+                    break;
+                case MarkdownSymbols.GroundChar:
+                    ParseItalicOrBoldAndAdvance(input, nestingStack);
+                    break;
+                case MarkdownSymbols.SharpChar:
+                    ParseHeadingAndAdvance(input);
+                    break;
+                default:
+                    ParseTextAndAdvance(input);
+                    break;
+            }
+        }
+
+        return tokens;
+    }
+
+    private void ParseSpaceAndAdvance() => tokens.Add(new SpaceToken(position++));
+
+    private void ParseHeadingAndAdvance(MarkdownLexerInput input)
+    {
+        if (input.NextIsSpace(position) && input.IsStartOfParagraph(position)) tokens.Add(new HeadingToken(position++));
+        else tokens.Add(new TextToken(position, MarkdownSymbols.Sharp));
+        position++;
+    }
+
+    private void ParseTextAndAdvance(MarkdownLexerInput input)
+    {
+        var value = new StringBuilder();
+        var start = position;
+        var endChars = new[]
+        {
+            MarkdownSymbols.SharpChar, MarkdownSymbols.GroundChar, MarkdownSymbols.NewLineChar,
+            MarkdownSymbols.EscapeChar, MarkdownSymbols.SpaceChar
+        };
+        while (position < input.Length && !endChars.Contains(input[position]) && !input.CurrentIsDigit(position))
+            value.Append(input[position++]);
+
+        if (value.Length > 0) tokens.Add(new TextToken(start, value.ToString()));
+        if (position < input.Length && input.CurrentIsDigit(position)) ParseNumberAndAdvance(input);
+    }
+
+
+    private void ParseNumberAndAdvance(MarkdownLexerInput input)
+    {
+        var sb = new StringBuilder();
+        var start = position;
+        while (position < input.Length && (input.CurrentIsDigit(position) || input[position] == MarkdownSymbols.GroundChar))
+            sb.Append(input[position++]);
+        tokens.Add(new NumberToken(start, sb.ToString()));
+    }
+
+    private void ParseItalicOrBoldAndAdvance(MarkdownLexerInput input, Stack<string> stack)
+    {
+        var isDoubleGround = input.NextIsGround(position);
+        var isTripleGround = input.NextIsDoubleGround(position);
+        var isSingleGround = !isTripleGround && !isDoubleGround;
+        if (stack.Count == 0) ParseItalicOrBoldAndAdvanceWhenStackEmpty(isSingleGround, isTripleGround, stack);
+        else if (stack.Count == 1)
+            ParseItalicOrBoldAndAdvanceWhenStackHasOne(isSingleGround, isDoubleGround, isTripleGround, stack);
+        else if (stack.Count == 2) ParseItalicOrBoldAndAdvanceWhenStackHasTwo(isSingleGround, isTripleGround, stack);
+    }
+
+    private void ParseItalicOrBoldAndAdvanceWhenStackEmpty(bool isSingleGround, bool isTripleGround,
+        Stack<string> stack)
+    {
+        if (isSingleGround)
+        {
+            ParseItalicAndAdvance();
+            stack.Push(MarkdownSymbols.Ground);
+            return;
+        }
+
+        ParseBoldAndAdvance();
+        stack.Push(MarkdownSymbols.DoubleGround);
+        if (!isTripleGround) return;
+        ParseItalicAndAdvance();
+        stack.Push(MarkdownSymbols.Ground);
+    }
+
+    private void ParseItalicOrBoldAndAdvanceWhenStackHasOne(bool isSingleGround, bool isDoubleGround,
+        bool isTripleGround,
+        Stack<string> stack)
+    {
+        switch (stack.Peek())
+        {
+            case MarkdownSymbols.DoubleGround when isSingleGround:
+                ParseItalicAndAdvance();
+                stack.Push(MarkdownSymbols.Ground);
+                break;
+            case MarkdownSymbols.DoubleGround:
+            {
+                if (isTripleGround) ParseItalicAndAdvance();
+                ParseBoldAndAdvance();
+                stack.Pop();
+                break;
+            }
+            case MarkdownSymbols.Ground:
+            {
+                if (isTripleGround)
+                {
+                    ParseBoldAndAdvance();
+                    ParseItalicAndAdvance();
+                }
+                else if (isDoubleGround)
+                {
+                    tokens.Add(new TextToken(position, MarkdownSymbols.DoubleGround));
+                    position += 2;
+                }
+                else ParseItalicAndAdvance();
+
+                stack.Pop();
+                break;
+            }
+        }
+    }
+
+    private void ParseItalicOrBoldAndAdvanceWhenStackHasTwo(bool isSingleGround, bool isTripleGround,
+        Stack<string> stack)
+    {
+        if (isSingleGround)
+        {
+            ParseItalicAndAdvance();
+            stack.Pop();
+            return;
+        }
+
+        if (isTripleGround) ParseItalicAndAdvance();
+        ParseBoldAndAdvance();
+
+        stack.Pop();
+        stack.Pop();
+    }
+
+    private void ParseBoldAndAdvance()
+    {
+        tokens.Add(new BoldToken(position));
+        position += 2;
+    }
+
+    private void ParseItalicAndAdvance()
+    {
+        tokens.Add(new ItalicToken(position));
+        position++;
+    }
+
+    private void ParseNewLineAndAdvance(Stack<string> stack)
+    {
+        tokens.Add(new NewLineToken(position));
+        stack.Clear();
+        position++;
+    }
+
+    private void ParseEscapeAndAdvance(MarkdownLexerInput input)
+    {
+        if (position + 1 >= input.Length)
+        {
+            tokens.Add(new TextToken(position++, MarkdownSymbols.Escape));
+            return;
+        }
+
+        if (input.NextIsDoubleGround(position))
+        {
+            tokens.Add(new TextToken(position, MarkdownSymbols.DoubleGround));
+            position += 3;
+            return;
+        }
+
+        var next = input[position + 1];
+        tokens.Add(escapedChars.Contains(next)
+            ? new TextToken(position, next.ToString())
+            : new TextToken(position, MarkdownSymbols.Escape + next));
+        position += 2;
+    }
+}
diff --git a/cs/Markdown/MarkdownLexerInput.cs b/cs/Markdown/MarkdownLexerInput.cs
@@ -0,0 +1,22 @@
+namespace Markdown;
+
+public class MarkdownLexerInput(string input)
+{
+    public bool NextIsDoubleGround(int position) =>
+        position + 2 < input.Length && input[position + 1] == MarkdownSymbols.GroundChar &&
+        input[position + 2] == MarkdownSymbols.GroundChar;
+
+    public bool NextIsSpace(int position) =>
+        position + 1 < input.Length && input[position + 1] == MarkdownSymbols.SpaceChar;
+
+    public bool NextIsGround(int position) =>
+        position + 1 < input.Length && input[position + 1] == MarkdownSymbols.GroundChar;
+
+    public bool CurrentIsDigit(int position) => char.IsDigit(input[position]);
+
+    public bool IsStartOfParagraph(int position) =>
+        position == 0 || position > 0 && input[position - 1] == MarkdownSymbols.NewLineChar;
+
+    public char this[int index] => input[index];
+    public int Length => input.Length;
+}