Чому забагато бінів на гістограмі погано?

0 Comments

Якщо у вас занадто багато бункерів, тоді розподіл даних буде виглядати грубим, і буде важко відрізнити сигнал від шуму. З іншого боку, із занадто малою кількістю відсіків гістограма не матиме деталей, необхідних для виявлення будь-якої корисної моделі з даних.

Використання занадто великої кількості класів може ускладнюють узагальнення моделей, пов’язаних із конкретними значеннями на горизонтальній осі. (Іншими словами, за деревами ви не можете побачити ліс.) Занадто мало класів може замаскувати важливі моделі.

Гістограма може ввести в оману, якщо він має оманливий масштаб і/або невідповідні початкову та кінцеву точки на осі Y. Спостерігайте за масштабом на осі y гістограми. Якщо вона йде з великим кроком і має кінцеву точку, яка набагато вища, ніж потрібно, ви побачите багато білого простору над гістограмою.

Виберіть від 5 до 20 бункерів. Що більший набір даних, то більша ймовірність того, що вам знадобиться велика кількість контейнерів. Наприклад, для набору з 12 фрагментів даних може знадобитися 5 бункерів, але набір із 1000 чисел, ймовірно, буде кориснішим із 20 бункерами. Точна кількість бункерів зазвичай є судженням.

На закінчення, невизначеність для кожного біну визначається за допомогою стандартного відхилення розподілу Пуассона √���� . Невизначеність гістограми знайдено за допомогою апроксимації стандартного відхилення розподілу Гауса FWHM/2.

Якщо у вас занадто багато бункерів, тоді розподіл даних буде виглядати грубим, і буде важко відрізнити сигнал від шуму. З іншого боку, із занадто малою кількістю бінів гістограма не матиме деталей, необхідних для виявлення будь-якої корисної моделі з даних.