|
| 1 | +using AlgorithmsLibrary.CommonClasses; |
| 2 | +using System; |
| 3 | +using System.Collections.Generic; |
| 4 | +using System.Linq; |
| 5 | +using System.Text; |
| 6 | +using System.Text.RegularExpressions; |
| 7 | +using System.Threading.Tasks; |
| 8 | + |
| 9 | +namespace AlgorithmsLibrary |
| 10 | +{ |
| 11 | + /// <summary> |
| 12 | + /// Здесь идея этого алгоритма. |
| 13 | + /// </summary> |
| 14 | + public static class LZ78Algm |
| 15 | + { |
| 16 | + public static IAlgmEncoded<List<LZ78CodeBlock>> Encode(string source) |
| 17 | + { |
| 18 | + string Buffer = ""; //строка для формирования ключа для словаря |
| 19 | + Dictionary<string, int> Dictionary = new Dictionary<string, int> { { "", 0 } }; |
| 20 | + List<LZ78CodeBlock> EncodedString = new List<LZ78CodeBlock>(); // ответ |
| 21 | + for (int i = 0; i < source.Length; i++) |
| 22 | + { |
| 23 | + if (Dictionary.ContainsKey(Buffer + source[i])) |
| 24 | + { // можем ли мы увеличить префикс |
| 25 | + Buffer += source[i]; |
| 26 | + } |
| 27 | + else |
| 28 | + { |
| 29 | + EncodedString.Add(new LZ78CodeBlock(Dictionary[Buffer], source[i])); // добавляем пару в ответ |
| 30 | + Dictionary.Add(Buffer + source[i], Dictionary.Count); // добавляем слово в словарь |
| 31 | + Buffer = string.Empty; |
| 32 | + } |
| 33 | + } |
| 34 | + // если буффер не пуст - этот код уже был, нужно его добавить в конец словаря |
| 35 | + if (!Buffer.Equals(string.Empty)) |
| 36 | + { |
| 37 | + var last_ch = Buffer.Last(); // берем последний символ буффера, как "новый" символ |
| 38 | + Buffer = Buffer.Remove(Buffer.Length - 1); // удаляем последний символ из буфера |
| 39 | + EncodedString.Add(new LZ78CodeBlock(Dictionary[Buffer], last_ch)); // добавляем пару в ответ |
| 40 | + } |
| 41 | + |
| 42 | + return new EncodedMessage<List<LZ78CodeBlock>>(EncodedString, CalculateCompressionRatio(source, EncodedString)); |
| 43 | + } |
| 44 | + |
| 45 | + private static List<LZ78CodeBlock> ParseEncodedString(string encodedString) |
| 46 | + { |
| 47 | + List<LZ78CodeBlock> encodedStringParsed = new List<LZ78CodeBlock>(); |
| 48 | + // вид кодового блока: |
| 49 | + //({0},{2})...({0},{2}) |
| 50 | + //парсит всю строку на блоки |
| 51 | + //globalCode - проверяет всю строку, подходит ли она для декодирования |
| 52 | + Regex globalCode = new Regex(@"(?=^)(([(](\d+)([,])(.|\n|\r|\t)[)])|(\s)|(\n)|(\r))+(?=$)"); |
| 53 | + Regex regex = new Regex(@"([(](\d+)([,])(.|\n|\r|\t)[)])"); //регулярка кодового блока |
| 54 | + Regex intRegex = new Regex(@"\d+"); //регулярка цыфры |
| 55 | + if (!globalCode.IsMatch(encodedString)) |
| 56 | + { |
| 57 | + throw new CodingException(); |
| 58 | + } |
| 59 | + |
| 60 | + MatchCollection matches = regex.Matches(encodedString); |
| 61 | + foreach (Match match in matches) |
| 62 | + { |
| 63 | + string codeBlock = match.Value; |
| 64 | + MatchCollection matchesBlock = intRegex.Matches(codeBlock); |
| 65 | + encodedStringParsed.Add(new LZ78CodeBlock(int.Parse(matchesBlock[0].Value), codeBlock[codeBlock.Length - 2])); |
| 66 | + } |
| 67 | + |
| 68 | + return encodedStringParsed; |
| 69 | + } |
| 70 | + |
| 71 | + private static double CalculateCompressionRatio(string sourceString, List<LZ78CodeBlock> compressionString) |
| 72 | + { |
| 73 | + //Считаем что в стандартной кодировке один символ = 8бит |
| 74 | + double countBitsSourceString = 8 * sourceString.Length; |
| 75 | + |
| 76 | + double countBitsCompressionString = 0; |
| 77 | + foreach (LZ78CodeBlock compression in compressionString) |
| 78 | + { |
| 79 | + int countBitsOffset = Convert.ToString(compression.Position, 2).Length; |
| 80 | + int countBitsChar = 8; |
| 81 | + |
| 82 | + countBitsCompressionString += countBitsOffset + countBitsOffset + countBitsChar; |
| 83 | + } |
| 84 | + |
| 85 | + return Math.Round(countBitsSourceString / countBitsCompressionString, 3); |
| 86 | + } |
| 87 | + |
| 88 | + public static IAlgmEncoded<string> Decode(string encodedString) |
| 89 | + { |
| 90 | + List<LZ78CodeBlock> encodedStringParsed = ParseEncodedString(encodedString); |
| 91 | + |
| 92 | + StringBuilder resultDecoding = new StringBuilder(string.Empty); |
| 93 | + |
| 94 | + List<string> dict = new List<string> { string.Empty }; // словарь, слово с номером 0 — пустая строка |
| 95 | + foreach (LZ78CodeBlock code in encodedStringParsed) |
| 96 | + { |
| 97 | + var word = dict[code.Position] + code.Char; // составляем слово из уже известного из словаря и новой буквы |
| 98 | + resultDecoding.Append(word); // приписываем к ответу |
| 99 | + dict.Add(word); // добавляем в словарь |
| 100 | + } |
| 101 | + |
| 102 | + string decodedString = resultDecoding.ToString(); |
| 103 | + return new EncodedMessage<string>(decodedString, CalculateCompressionRatio(decodedString, encodedStringParsed)); |
| 104 | + } |
| 105 | + } |
| 106 | +} |
0 commit comments