|
|
Тема 7.
Статистическая обработка данных
>>Упражнения
|
- Подсчитайте среднюю длину слова, среднюю длину предложения, частота знаков препинания для текста (страница формат А4, размер шрифта 14). Если в качестве текста брать разные художественные произведения, то позволит ли такой статистический анализ хоть в какой-то мере достоверно определить их авторов?
- Построить таблицу, содержащую алфавитно-частотный список слов для текста (страница формат А4, размер шрифта 14);
- построить на основе первой таблицы таблицу ранжирования;
- построить график зависимости ранга и частоты вхождения слова;
- выделить значимые слова для данного текста.
|
- Построить таблицу, содержащую алфавитно-частотный список слов для нескольких текстов (использовать результаты предыдущего задания);
- найти среднюю арифметическую частоту, среднее квадратическое отклонение и коэффициент вариации;
- выделить ключевые слова для каждого текста и для нескольких текстов.
|
|
|