การดูข้อมูลในเชิงสถิติ
เราสามารถดูการกระจายของข้อมูล และเลือกว่าจะให้ข้อมูลของเราแสดงอะไรออกมาบ้าง โดยอยู่บนพื้นฐานของ ประเภทและช่วงของข้อมูลได้
การดูการแจกแจงหรือการกระจายของข้อมูล รวมถึงการกรองข้อมูล จะช่วยได้มากในการแยกแยะ เช่นเราสามารถรู้ได้ทันทีว่า ในแต่ละข้อมูลมีกิจกรรม มากน้อยเพียงใด
เราสามารถดูการกระจายของข้อมูล ได้หลายรูปแบบ เช่น
- Bar chart
- Histograms
- Heat matrics
Bar chart คือ แผนภูมิแท่ง:แผนภูมิที่ประกอบด้วยรูปสี่เหลี่ยมผืนผ้าที่ความยาวของแต่ละแท่งแปรตามขนาดของข้อมูล แต่ความกว้างเท่ากัน แท่งเหล่านี้อาจเรียงตามแนวตั้งหรือแนวนอนก็ได้ การใช้ Bar Chart มีประโยชน์สำหรับดูการกระจายของข้อมูลหรือการแจกแจกของข้อมูล ผ่านหมวดหมู่ต่างๆๆ เช่น ในชาร์ตมีข้อมูลการทำธุรกรรม เราอาจจะมองดูการกระจายของข้อมูลโดยผ่านทางประเภทของชนิดของบัญชี ได้
ฮิสโตแกรม (Histogram) คือกราฟแท่งแบบเฉพาะที่แสดงความสัมพันธ์ระหว่างข้อมูลเป็นหมวดหมู่ที่เรียกว่าชั้นข้อมูลกับความถี่ของข้อมูล เพื่อดูการกระจายของข้อมูล ลักษณะของข้อมูลที่เป็นหมวดหมู่จะเรียงลำดับจากน้อยไปหามากโดยจำนวนหมวดหมู่ของข้อมูลจะจัดตามความเหมาะสม โดยแกนตั้งจะเป็นตัวเลขแสดง “ ความถี่ ” และแกนนอนจะเป็นข้อมูลคุณสมบัติของสิ่งที่เราสนใจ แท่งกราฟแต่ละแท่งจะมีความกว้างเท่ากันซึ่งเท่ากับกว้างของชั้นข้อมูล ส่วนความสูงของกราฟแต่ละแท่งนั้นจะสูงเท่ากับจำนวนความถี่ของแต่ละชั้นข้อมูล การใช้ Histogram มีประโยชน์สำหรับดูช่วงของข้อมูล เช่นในชาร์ตของเรามี ข้อข้อมูลการทำธุรกรรม เราอาจจะเลือกที่จะดูการกระจายของข้อมูล ตามมูลค่าของธุรกรรมภายในช่วงที่กำหนด
Heat matrices จะแสดงออกเป็นภาพ ให้เห็นความสำพันธ์ระหว่างคุณสมบัติของรายการของชาร์ต ในตาราง ที่โชว์จำนวนที่เกิดขึ้นของค่าต่างๆๆ ที่เอามารวมกัน มีประโยชน์สำหรับการเปรียบเทียบการกระจายข้อมูลในสองมิติ ตัวอย่างเช่น ในชาร์ตที่มีข้อมูลธุรกรรม เราต้องการดูจำนวนธุรกรรมที่รวมอยู่ในแต่ละชั่วโมงของวันและวันในสัปดาห์รวมกันได้
- Ends – Account Type คือชนิดของบัญชีธนาคาร
- Links – Transaction date and time เช่น การโอนเงิน วันเวลา
- Both – Label text ในส่วนนี้จะแสดงให้เห็นทั้งคู่