19-09-2021
Nếu đang cố gắng hiểu nhanh về một lĩnh vực mới, một trong những điều quan trọng nhất bạn có thể làm là xác định những sai lầm phổ biến mà mọi người mắc phải, sau đó tránh chúng. Dưới đây là một số lỗi dễ dự đoán nhất mà chúng ta thường mắc phải khi nghĩ về số liệu thống kê.
Những người nghiệp dư có xu hướng tập trung vào việc tìm kiếm sự sáng chói. Các chuyên gia thường biết rằng tránh ngu ngốc sẽ hiệu quả hơn nhiều. Những lỗi sai điển hình thường mắc phải là cách đơn giản nhất để vượt lên trước đám đông.
Hiểu rõ hơn về xác suất sẽ cung cấp cho bạn bức tranh chính xác hơn về thế giới và giúp bạn đưa ra quyết định tốt hơn. Tuy nhiên, nhiều người trở thành con mồi của những vấn đề tương tự vì các khía cạnh của xác suất đi ngược lại với những gì chúng ta nghĩ là trực quan. Ngay cả khi bạn chưa nghiên cứu chủ đề này từ thời trung học, bạn vẫn có thể sử dụng các bài đánh giá xác suất mỗi ngày trong công việc và cuộc sống của mình.
Trong “Naked Statistics”, Charles Wheelan đưa người đọc tham quan một cách ngoạn mục về những điều cơ bản của thống kê. Trong một chương, ông đưa ra các gợi ý để tránh một số “lỗi phổ biến nhất liên quan đến xác suất, hiểu lầm và tình huống khó xử về đạo đức”. Cho dù bạn là người mới bắt đầu với chủ đề này hay chỉ muốn học lại, đây là bản tóm tắt các bài học của Wheelan và cách bạn có thể áp dụng chúng.
***
“Xác suất sấp ngửa với đồng xu là 1/2. Xác suất lật ngửa hai lần liên tiếp là (1/2) ^ 2 hoặc 1/4 vì khả năng xảy ra hai sự kiện độc lập là tích của các xác suất riêng lẻ của chúng”
Khi một sự kiện được kết nối với một sự kiện khác, sự kiện xảy ra trước làm tăng hoặc giảm xác suất của sự kiện sau xảy ra. Bảo hiểm xe hơi sẽ đắt hơn sau một vụ tai nạn vì tai nạn xe hơi không phải là những sự kiện độc lập. Một người bị một lần tai nạn có nhiều khả năng bị một tai nạn khác trong tương lai. Có thể họ không phải là một người lái xe giỏi, có thể họ có xu hướng lái xe sau khi uống rượu, hoặc có thể thị lực của họ không hoàn hảo. Dù giải thích thế nào, các công ty bảo hiểm đều biết sửa đổi bản đánh giá rủi ro của họ.
Tuy nhiên, đôi khi một sự kiện xảy ra có thể dẫn đến những thay đổi khiến nó ít xảy ra hơn trong tương lai. Nếu bạn làm đổ cà phê vào áo sơ mi của mình vào sáng nay, bạn có thể ít làm như vậy vào chiều nay vì bạn sẽ thận trọng hơn. Nếu một hãng hàng không gặp sự cố vào năm ngoái, bạn có thể sẽ an toàn hơn khi bay cùng họ vì họ sẽ thực hiện nhiều cải tiến đối với các quy trình an toàn của mình để ngăn ngừa một thảm họa khác.
Một nơi mà chúng ta nên chú ý đến tính độc lập hay phụ thuộc của các sự kiện là khi lập kế hoạch. Hầu hết các kế hoạch của chúng ta không diễn ra như chúng ta muốn. Chúng ta bị trì hoãn, chúng ta phải lùi lại, chúng ta phải thực hiện những thay đổi bất ngờ. Đôi khi chúng ta nghĩ rằng có thể bù đắp cho sự chậm trễ trong một phần của kế hoạch bằng cách tiến hành nhanh hơn sau đó. Nhưng các phần của một kế hoạch không độc lập. Sự chậm trễ trong một phần làm cho sự chậm trễ ở những phần khác dễ xảy ra hơn do các vấn đề phức tạp và tích tụ.
Bất cứ khi nào bạn nghĩ về xác suất của các chuỗi sự kiện, hãy nhớ xác định xem chúng có độc lập hay không.
***
“Một loại sai lầm khác xảy ra khi các sự kiện độc lập không được xử lý như vậy… Nếu bạn tung một đồng xu 1.000.000 lần và có 1.000.000 mặt sấp liên tiếp, xác suất bạn có mặt sấp trong lần tung tiếp theo vẫn là 1/2. Định nghĩa về tính độc lập thống kê giữa hai sự kiện là kết quả của một sự kiện không ảnh hưởng đến kết quả của một sự kiện khác”.
Hãy tưởng tượng bạn đang ăn một chiếc bánh sandwich tại một quán cà phê khi một ai đó thô lỗ xông vào xếp hàng trước mặt bạn và phớt lờ sự phản đối của bạn. Cuối ngày hôm đó, khi bạn đang đợi đến lượt gọi một ly cà phê ở một quán cà phê khác, điều tương tự sẽ xảy ra: một người lạ ngẫu nhiên chen vào trước mặt bạn. Vào lúc bạn đi chọn một số bánh ngọt cho con bạn ở một nơi khác trước khi về nhà vào buổi tối hôm đó, bạn quá khó chịu với tất cả sự thô lỗ mà bạn gặp phải đến mức bạn tức giận đánh mắt mọi người vào cửa hàng, đề phòng bất kỳ nỗ lực nào để chen hàng trước bạn. Nhưng tất nhiên, hai người lạ thô lỗ là những sự kiện độc lập. Không chắc họ đã làm việc cùng nhau để làm phiền bạn. Thực tế là nó đã xảy ra hai lần trong một ngày không làm cho nó xảy ra lần thứ ba dễ xảy ra hơn.
Điều quan trọng nhất cần nhớ ở đây là xác suất của các sự kiện liên hợp xảy ra không bao giờ cao hơn xác suất của mỗi sự kiện xảy ra.
***
“Bạn có thể đã đọc câu chuyện trên báo hoặc có thể thấy tin tức tiết lộ: Một số thống kê không chắc có số người ở một khu vực cụ thể đã mắc một dạng ung thư hiếm gặp. Nó phải là nước, hoặc nhà máy điện địa phương, hoặc tháp điện thoại di động.
…Nhưng cụm trường hợp này cũng có thể là sản phẩm của sự may rủi thuần túy, ngay cả khi số lượng trường hợp có vẻ không chắc chắn. Đúng, xác suất để năm người trong cùng một trường học, nhà thờ hoặc nơi làm việc mắc cùng một dạng bệnh bạch cầu hiếm gặp có thể là một phần triệu, nhưng có hàng triệu trường học, nhà thờ và nơi làm việc. Không có khả năng cao là năm người có thể mắc cùng một dạng bệnh bạch cầu hiếm gặp ở một trong những nơi đó”.
Một bài học quan trọng của xác suất là trong khi riêng rẽ các sự kiện khó xảy ra sẽ không xảy ra, khả năng bất kỳ sự kiện khó xảy ra rất có thể xảy ra nếu tính trên diện rộng. Cơ hội trúng số của bạn gần như bằng không. Nhưng ai đó phải giành được nó. Khả năng bạn bị sét đánh gần như bằng không. Nhưng với bao nhiêu người đi lại và bao nhiêu giông tố, chuyện sớm muộn gì cũng phải xảy đến với ai đó.
Điều này cũng đúng đối với các cụm sự kiện khó xảy ra. Cơ hội của bất kỳ cá nhân nào trúng xổ số nhiều lần hoặc bị sét đánh nhiều lần thậm chí còn gần bằng 0 hơn cơ hội xảy ra một lần. Tuy nhiên, khi chúng ta nhìn vào tất cả mọi người trên thế giới, điều đó chắc chắn sẽ xảy ra với một người nào đó.
Tất cả chúng ta đều là những sinh vật phù hợp với khuôn mẫu. Chúng ta nhận thấy sự ngẫu nhiên khó xử lý và tìm kiếm ý nghĩa trong các sự kiện hỗn loạn. Vì vậy, không có gì ngạc nhiên khi các cụm thường đánh lừa chúng ta. Nếu bạn gặp phải, hãy lưu ý khả năng đó là sản phẩm của sự tình cờ chứ không phải bất cứ điều gì có ý nghĩa hơn. Chắc chắn, việc dính líu đến ba vụ tai nạn ô tô trong một năm hoặc đụng độ hai người bạn cùng phòng đại học trong cùng một hội nghị có thể là một điều khó chịu. Tuy nhiên, có phải tất cả những điều không thể ngờ rằng nó sẽ xảy ra với một người nào đó?
***
“Sự ngụy biện của công tố viên xảy ra khi bối cảnh xung quanh bằng chứng thống kê bị bỏ quên… cơ hội tìm thấy một sự trùng hợp ngẫu nhiên trong một triệu trận đấu là tương đối cao nếu bạn chạy cùng một cơ sở dữ liệu với các mẫu từ một triệu người”.
Điều quan trọng là phải xem xét bối cảnh xung quanh số liệu thống kê. Giả sử bạn đang đánh giá xem có nên dùng loại thuốc mà bác sĩ đề nghị hay không. Nhìn lướt qua tờ rơi thông tin sẽ cho bạn biết rằng nó có 1 trong 10.000 nguy cơ hình thành cục máu đông. Bạn có nên lo lắng? Vâng, điều đó phụ thuộc vào ngữ cảnh. Con số 1 trên 10.000 tính đến nhiều người có các gen khác nhau và lối sống khác nhau có thể dùng thuốc. Nếu bạn là một người nghiện thuốc lá thừa cân có tiền sử gia đình bị cục máu đông, đi máy bay mười hai giờ hai lần một tháng, bạn có thể muốn thảo luận nghiêm túc hơn với bác sĩ của mình so với một người không hút thuốc tích cực và không có tiền sử gia đình liên quan.
Số liệu thống kê cung cấp cho chúng ta một bức ảnh chụp nhanh đơn giản, nhưng nếu chúng ta muốn có một bức ảnh chi tiết hơn, chúng ta cần phải suy nghĩ về ngữ cảnh.
***
“Xác suất cho chúng ta biết rằng bất kỳ ngoại lệ nào – một quan sát đặc biệt xa so với giá trị trung bình theo hướng này hay hướng khác – đều có khả năng được theo sau bởi các kết quả phù hợp nhất với mức trung bình dài hạn.
…Một cách để suy nghĩ về sự đảo ngược có nghĩa này là hiệu suất – cả tinh thần và thể chất – bao gồm nỗ lực tiềm ẩn liên quan đến tài năng cộng với một yếu tố may mắn. (Các nhà thống kê gọi đây là lỗi ngẫu nhiên.) Trong mọi trường hợp, những cá nhân nào có kết quả vượt xa mức trung bình trong một khoảng thời gian nào đó có khả năng đã gặp may mắn về phía họ; những người thực hiện thấp hơn nhiều so với mức trung bình có thể đã gặp vận rủi… Khi một câu thần chú rất may mắn hoặc rất xui xẻo kết thúc — như nó chắc chắn sẽ xảy ra — kết quả đạt được sẽ gần với mức trung bình hơn”.
Các sự kiện bình thường có xu hướng theo sau những sự kiện cực đoan. Một lĩnh vực mà hồi quy về giá trị trung bình thường khiến chúng ta hiểu nhầm là khi xem xét cách mọi người thực hiện trong các lĩnh vực như thể thao hoặc quản lý. Chúng ta có thể nghĩ rằng một thành công phi thường duy nhất là dự báo cho những thành công trong tương lai. Tuy nhiên, từ một kết quả, chúng ta không thể biết đó là kết quả của tài năng hay may mắn — trong trường hợp đó, kết quả tiếp theo có thể là trung bình. Thất bại hoặc thành công thường được theo sau bởi một sự kiện gần với mức trung bình hơn, chứ không phải ở cực khác.
Hồi quy về mức trung bình dạy chúng ta rằng cách để phân biệt giữa kỹ năng và may mắn là nhìn vào thành tích của ai đó. Bạn càng có nhiều thông tin thì càng tốt. Ngay cả khi hiệu suất trong quá khứ không phải lúc nào cũng dự đoán được hiệu suất trong tương lai, thì hồ sơ theo dõi về hiệu suất cao nhất quán là một chỉ số tốt hơn nhiều so với một điểm nổi bật duy nhất.
***
Nếu bạn muốn có một chuyến tham quan có thể truy cập vào các số liệu thống kê cơ bản, hãy xem “Naked Statistics” của Charles Wheelan.
Nguồn: fs.blog
Nếu bạn đang trăn trở hoặc mong muốn có được phẩm chất sáng tạo, mời bạn đăng ký ngay khóa học PHƯƠNG PHÁP LUẬN SÁNG TẠO và ĐỔI MỚI tại Trung tâm Sáng tạo Khoa học–kỹ thuật (TSK) thuộc trường Khoa Học Tự Nhiên nhé. Đây là môn học bổ ích cho mọi đối tượng, mọi ngành nghề có thể áp dụng, phát triển khả năng ứng phó và đưa ra các giải pháp thông minh cho công việ, cuộc sống. Bạn có thể điền thông tin tại đây hoặc liên hệ số điện thoại: (028) 38 301 743; 089 668 36 31 để thực hiện đăng ký.
Để luyện TÂM sáng TRÍ, cải thiện tư duy, thân mời bạn tham dự Khóa học ngắn hạn Nhìn Thấu – Nghĩ Thông – Hành Động Sáng Suốt thuộc chuỗi LEARNING TO BE được tổ chức thường xuyên khi đủ học viên, nội dung khóa học và link đăng ký vui lòng xem tại: https://bit.ly/2EEL2xK.
TRIZGyrus TEAM