8.3· Chapter 8: Статистика и анализ данных· ~10 мин

Представление информации

Таблицы, диаграммы и чтение данных.

Информацию можно представлять в таблицах и диаграммах, чтобы легче видеть закономерности. Чтобы кратко описать набор данных, используют среднее, медиану, моду и размах.

Ключевые термины

Среднее арифметическоеСумма всех значений, делённая на их количество. Например, для 50,70,6050,70,60 среднее равно 6060.
МедианаСерединное значение упорядоченного ряда; при чётном числе значений — среднее двух центральных.
МодаЗначение, которое встречается в наборе чаще всего.
РазмахРазность между наибольшим и наименьшим значениями: maxmin\max-\min.
Столбчатая диаграммаДиаграмма для сравнения значений по категориям.
Линейный графикГрафик для показа изменения величины во времени.
Выбор способа представления данных
ЗадачаПодходящий вид
Сравнение по категориямСтолбчатая диаграмма
Изменение во времениЛинейный график
Доли от целогоКруговая диаграмма
Точные значенияТаблица

Каждому типу задачи соответствует свой способ представления.

Числовые характеристики набора
ХарактеристикаКак найти
Среднеесуммаколичество\dfrac{\text{сумма}}{\text{количество}}
МедианаСерединное значение упорядоченного ряда
МодаСамое частое значение
Размахmaxmin\max-\min

Перед поиском медианы числа обязательно упорядочивают.

Медиана при чётном числе значений: 5,2,8,3,7,9,1,45,2,8,3,7,9,1,4
  1. 1Упорядочим: 1,2,3,4,5,7,8,91,2,3,4,5,7,8,9 — всего 88 чисел.
  2. 2Найдём центр: Центральные значения — 44 и 55 (4-е и 5-е).
  3. 3Среднее центральных: 4+52=92=4.5\dfrac{4+5}{2}=\dfrac{9}{2}=4.5.
  4. 4Ответ: Медиана =4.5=4.5.
Среднее продаж по месяцам: Янв =50=50, Фев =70=70, Мар =60=60
  1. 1Сумма: 50+70+60=18050+70+60=180.
  2. 2Количество: Значений 33.
  3. 3Делим: 1803=60\dfrac{180}{3}=60.
  4. 4Ответ: Среднее =60=60.
🚫Частая ошибка

Перед поиском медианы числа нужно упорядочить. Для 5,2,8,3,7,9,1,45,2,8,3,7,9,1,4 медиана не 77, а 4.54.5: упорядоченный ряд даёт центр 44 и 55.

⚠️Внимание

При выбросах (например 1,2,3,4,1001,2,3,4,100) среднее сильно завышается, поэтому центр лучше описывает медиана, а не среднее.

💡Заметка

Размах находят как maxmin\max-\min. Для 10,20,30,40,5010,20,30,40,50 это 5010=4050-10=40.

💡Заметка

Среднее и медиана равны при симметричном распределении, например для 10,20,30,40,5010,20,30,40,50 обе равны 3030.

Правила

  1. 1Выбери подходящий способ представления.
  2. 2Сравни значения между категориями.
  3. 3Сделай вывод на основе данных.
  4. 4Среднее: сумма значений делится на их количество.
  5. 5Медиана: серединное значение упорядоченного ряда; при чётном числе — среднее двух средних.
  6. 6Размах: размах=maxmin\text{размах}=\max-\min.

Тренировка

10 лёгких · 10 средних · 10 сложных

В каждом тесте — 10 случайных вопросов