Работа с текстовыми строками

Текстовые строки – переменные типа string – могут содержать любое количество символов. Каждый символ представлен в кодировке UNICODE, предполагающей представление одного символа в 2 байтах памяти. Работа с текстовыми строками обычно предполагает решение следующих задач: объединить две (или более) строки в одну, вырезать из строки фрагмент, найти в строке заданную подстроку и т.п.

Для текстовых строк определены операции конкатенации (объединение) строк. Эта операция может быть выполнена с помощью оператора «+» или метода String.Сoncat, сравнение строк: операторы равенства == и !=. Оператор [] служит для доступа (только для чтения) к отдельным символам объекта string. Например, объединение строк:

string str1="Катя";

string str2="Иванова";

string res = str1+ " "+ str2;

Console.WriteLine(res);

Строка res будет следующей: ”Катя Иванова”.

Этот же результат можно получить с помощью метода Concat:

string res1 = String.Concat(str1, " ",str2);

В списке аргументов метода Сoncat может быть не более четырех членов. В приведенном выше примере их три.

Текстовые строки имеют сходство с массивами в том смысле, что доступ к отдельным символам осуществляется по индексу (номеру позиции, нумерация начинается с нуля). Переход к следующему символу легко осуществляется изменением номера позиции на 1. Однако следует иметь в виду, что изменение однажды созданной строки не допускается. Чтобы внести требуемые изменения, нужно создать новую строку (см. пример 6.1) или использовать соответствующий метод.

Для работы со строками определены методы класса String.

1. Метод Substring(n, m) – извлечение подстроки длиной m, начиная с n-го символа. Если m не указано, то выводится весь «хвост» строки, начиная с n-го символа. Например, применение метода Substring для строки res:

string str1 = "Катя";

string str2 = "Иванова";

string res = str1 + " " + str2;

Console.WriteLine(res);

string res2 = res.Substring(5, 7);

Console.WriteLine(res2);

2. Метод Insert(n, st) – вставка подстроки st в исходную строку, начиная с n-ой позиции. При этом необходимо создать новую переменную, в которой вначале будет автоматически продублирована исходная строка, а затем выполнена необходимая операция. (Заметим, что в C# прямая модификация существующей строки невозможна.) Например,

string res3 = "Катя";

string res4 = res3.Insert(4, " Иванова");

Console.WriteLine(res4);

В результате в res4 будет ”Катя Иванова”.

3. Метод Replace(st, st1) – замена подстроки st новой подстрокой st1 или замена какого-либо символа во всем тексте на другой символ. Например,

string str = "Катя Иванова";

string str1 = str.Replace("Катя","Екатерина");

В результате будет str1 = "Екатерина Иванова".

4. Метод Remove(n, m) – удаление из строки фрагмента заданной длины m, начинающегося с заданной позиции n. Например,

string res = "Катя Иванова – моя подруга";

string res1 = res.Remove(4, 8);

Console.WriteLine(res1);

Удаляются 8 символов, начиная с 4-го (пробел после слова ”Катя”). В результате будет res1 = ”Катя – моя подруга”.

5. Метод ToString() – получение строкового представления объекта числового типа. Внутри скобок может ничего не находиться или может находиться переменная (строка формата), в которой указан способ форматирования числа, сохраненного в строковом виде, при выводе на консоль. Например,

double a = 5.0;

string s = a.ToString("f3");

Console.WriteLine(s);

Console.WriteKey();

6. Метод Split (применается к экземпляру класса String, как и описанные выше методы) осуществляет разбор строки, т.е. позволяет выделить отдельные слова или другие сочетания символов, разделенные какими-либо разделителями, перечисляемыми в массиве символов типа char[], являющемся аргументом метода Split. Например,

string str = "собака, кот играют вместе";

string[] strarr = str.Split(new Char[] {' ',','});

foreach(string res in strarr)

{

Console.WriteLine(res);

}

Console.ReadKey();

Здесь формируется массив strarr из слов исходного текста, отделенных друг от друга пробелом или запятой. Список символов-разделителей помещается в массив и передается методу Split в качесте аргумента.

При выводе после первого слова выведена пустая строка, так как после первого разделителя сразу следует второй, и между ними ничего нет (пусто).

Каждый отдельный символ строки является значением типа char и может быть выделен в переменную типа char. Например, при выполнении оператора

char s = str[5];

для str из предыдущего примера s получит значение a.

Для работы с отдельными символами строки можно использовать методы структуры Char. Например, статический метод Char.IsDigit(s), где s – переменная типа char (отдельный символ строки). Этот метод возвращает значение true, если s – цифра и false, если s – не цифра. Результат выполнения метода показывает, относится ли указанный символ Юникода к категории десятичных цифр или нет.

Пример 6.1. В исходном тексте одно слово от другого отделено одним пробелом. Сформировать текст, в котором одно слово от другого отделяется двумя пробелами:

using System;

class Program

{

static void Main()

{

string str1 =

"Введите верхний треугольник "

+ "матрицы по строкам";

string str2 = "";

for (int i = 0; i < str1.Length; i++)

{

if (str1[i] == ' ')

{

str2 = str2 + str1[i];

}

str2 = str2 + str1[i];

}

Console.WriteLine(str1);

Console.WriteLine(str2);

}

}

Пример 6.2. Выписать из текста слова, начинающиеся и заканчивающиеся на одну и ту же букву:

using System;

class Program

{

static void Main()

{

string str1 = "текст верхний треугольник"

+ "тееекст теекст треугольник ";

Console.WriteLine(str1);

Console.WriteLine();

int i = 0, j = 0;

while (i < str1.Length)

{

if (str1[i] == ' ')

{

if (str1[i - 1] == str1[j])

{

Console.WriteLine(

str1.Substring(j, i - j));

}

j = i + 1; i++;

}

else

{

i++;

}

}

}

}

Пример 6.3. Подсчитать, сколько слов в тексте начинается на букву т. Слова в тексте разделены пробелами:

using System;

class Program

{

static void Main()

{

string str1 = "текст верхний треугольник"

+ "теекст треугольник верхний";

Console.WriteLine(str1);

Console.WriteLine();

string[] masstr = str1.Split(' ');

int k = 0;

for (int i = 0; i < masstr.Length; i++)

{

if (masstr[i][0] == 'т') k++;

}

Console.WriteLine(k);

Console.ReadKey();

}

}

Пример 6.4. Определить, сколько в заданном тексте отдельно цифр (Digit), букв (Letter), заглавных букв (Upper) и разделителей (Separator):

using System;

class Program

{

static void Main()

{

string str = "g E r t R 1 2 d K";

Console.WriteLine(str);

Console.WriteLine();

int k = 0, l = 0, m = 0, j = 0;

for (int i = 0; i < str.Length; i++)

{

if (Char.IsDigit(str[i])) k++;

if (Char.IsLetter(str[i])) l++;

if (Char.IsUpper(str[i])) m++;

if (Char.IsSeparator(str[i])) j++;

 

}

Console.WriteLine(

"цифры {0} буквы {1} заглавные буквы "

+"{2} разделитель {3}", k, l, m, j);

}

}

Вопросы для самопроверки

1. Как задать текстовую строку?

2. Какие операции определены для текстовых строк?

3. Как получить доступ к отдельным символам строки?

4. Методы, определенные для символьных строк.

5. Методы, определенные для отдельных символов.

6. Как можно изменить строку в процессе выполнения программы?

Задание для самостоятельного выполнения

1. Задан текст, содержащий не более 255 символов. Определить частоту, с которой встречаются в тексте различные буквы русского алфавита (в долях от общего количества букв).

2. Ученики зашифровывают свои записки, записывая все слова наоборот. Составить программу, зашифровывающую и расшифровывающую сообщение.

3. Разбить исходный текст на строки длиной не более 50 символов. Перенос на новую строку осуществлять на месте пробела (слова не переносить).

4. Назовем сложностью предложения сумму количества слов и знаков препинания. Определить сложность заданного предложения.

5. Задан текст символов. Напечатать буквы, на которые начинаются слова в тексте, в порядке убывания частоты их употребления.

6. Определить, сколько слов в тексте содержит один слог, два слога, три слога и т.д.

7. Задан текст символов. Выписать все слова, включающие заданную последовательность букв (например, выписать однокоренные слова).

8. Разделить заданный текст (не более 1000 символов) на строки, содержащие не более 50 символов. (Перенос осуществлять на месте пробела). Добавить равномерно пробелы, чтобы каждая строка содержала ровно 50 символов.

9. Для хранения текста в сжатом виде найти часто повторяющиеся последовательности из двух букв и заменить их кодом. В качестве кода использовать символы, не встречающиеся в тексте. Составить также таблицу кодов.

10. В предыдущей задаче декодировать текст, хранящийся в сжатом виде, используя заданную таблицу кодов.

11. Список фамилий, разделенных запятыми, задан в произвольном порядке. Упорядочить его по алфавиту.

12. Считая, что в памяти компьютера хранится таблица кодов часто встречающихся слов, ввести текст в массив, заменяя слова кодами после ввода. Распечатать текст в исходном виде, т.е. заменяя коды словами.

13. Определить долю в процентах слов, начинающихся на различные буквы. Выписать эти буквы и доли начинающихся на них слов.

14. Текст содержит слова и целые числа от 1 до 10. Найти сумму включенных в текст чисел.

15. Текст содержит слова и целые числа произвольного порядка. Найти сумму включенных в текст чисел.