Viết xong cái entry về chiều cao và tổng thống Mĩ tôi chợt thấy một bài báo thú vị có tên là “Is Presential Greatness Related to Height?” của Paul Sommers, giáo sư kinh tế của trường Middlebury College (bang Vertmont). Bài đăng trên tập san The Colege Mathematical Journal năm 2002, số 33, trang 14-16.
Ông giáo sư này làm thống kê chiều cao của tổng thống Mĩ trước. Sau đó ông tìm những đánh giá của giới sử gia Mĩ về thành tựu của họ trong thời gian tại chức. Thành tựu ở đây là chính sách kinh tế, giáo dục, y tế, khả năng ứng biến trong tình hình chiến tranh và khủng hoảng. Có bốn bậc thành tựu: great (lớn), near great (gần lớn), above average (trên trung bình), average (trung bình), below average (dưới trung bình), và failure (thất bại). Có một số tổng thống mà người ta không đánh giá được và kí hiệu là “na” (not available hay not applicable). Số liệu đó được trình bày trong bảng dưới đây.
Câu hỏi ông đặt ra là: có mối tương quan nào giữa chiều cao và thành tựu hay không? Cách đơn giản nhất để kiểm định giả thuyết này là tính chiều cao trung bình cho từng bậc. Tôi tính thử thì thấy như sau:
Thành tựu
|
Số tổng thống
|
Chiều cao trung bình và độ lệch chuẩn
|
Great
|
4
|
188 (0.5)
|
Near Great
|
4
|
179 (4.2)
|
Above Average
|
9
|
179 (9.2)
|
Average
|
11
|
177 (7.7)
|
Below Average
|
7
|
179 (4.2)
|
Failure
|
5
|
180 (4.7)
|
Như vậy, chiều cao xem ra có tương quan với mức độ thành tựu. Chiều cao càng cao thành tựu càng lớn. Nếu chúng ta chia thành tựu thành 3 nhóm: Great và Near Great thành một nhóm, average và above average thành một nhóm, và below average và failure, thì kết quả sẽ là:
Thành tựu
|
Số tổng thống
|
Chiều cao trung bình và độ lệch chuẩn
|
Great + Near Great
|
8
|
184 (5.4)
|
Average + Above Average
|
20
|
178 (8.2)
|
Failure + Below Average
|
12
|
179 (4.2)
|
Rõ ràng có sự khác biệt về chiều cao và sự thành tựu của tổng thống. Nhưng thú vị hơn có lẽ là lời giải thích và lí thuyết đằng sau nó. Tôi thấy lí thuyết Darwin khá thuyết phục ở đây, nhưng tôi sẽ … không nói. :-)
Dựa vào kết quả quá khứ, có thể nói xác suất Obama trở thành một tổng thống “Great” hay “Near Great” có thể cao đấy. Cao bao lăm thì tôi để cho các bạn tính (vẫn mô hình logistic thôi). :-)
Còn George W. Bush? Dựa vào mô hình trên (chiều cao của GWB là 180 cm), tôi tính thấy xác suất ông ấy đắc cử là 50%. Còn xác suất làm tổng thống "great" hay "near great" thì exp(a+b*height) / (1+exp(a+b*height)), trong đó a=-26.573, b=0.1383) thì xác suất Bush làm tổng thống bậc đó chỉ 15%, ngay cả xác suất ông ấy trên trung bình (với a=-12.1322 và b=0.0651) cũng chỉ 37%.
Mua vui cũng được một vài phút giây. (Xin lỗi Tiên Điền tiên sinh tôi đã sửa lời của cụ!)
NVT
Danh sách tổng thống, chiều cao (cm) và thành tựu
Tên
|
Chiều cao
|
Thành tựu
|
Abraham Lincoln
|
188
|
great
|
Andrew Jackson
|
185
|
near great
|
Andrew Johnson
|
178
|
failure
|
Barack Obama
|
187
|
na
|
Benjamin Harrison
|
168
|
average
|
Bill Clinton
|
189
|
above ave
|
Calvin Coolidge
|
178
|
below ave
|
188
|
average
| |
Dwight D Eisenhower
|
179
|
above ave
|
Franklin D Roosevelt
|
188
|
great
|
Franklin Pierce
|
178
|
below ave
|
George H W Bush
|
188
|
average
|
George W Bush
|
180
|
below ave
|
George Washington
|
188
|
great
|
Gerald Ford
|
183
|
average
|
Grover
|
180
|
above ave
|
Harry S Truman
|
175
|
near great
|
Herbert Hoover
|
180
|
average
|
James Buchanan
|
183
|
failure
|
James Garfield
|
183
|
na
|
James Madison
|
163
|
above ave
|
James Monroe
|
183
|
above ave
|
James Polk
|
173
|
above ave
|
Jimmy Carter
|
175
|
average
|
John Adams
|
170
|
average
|
John F Kennedy
|
183
|
above ave
|
John Quincy
|
170
|
above ave
|
John Tyler
|
183
|
below ave
|
Lyndon B Johnson
|
192
|
above ave
|
Martin Van Buren
|
168
|
average
|
Millard Fillmore
|
175
|
below ave
|
Richard Nixon
|
182
|
failure
|
Ronald Reagan
|
185
|
below ave
|
Rutherford B Hayes
|
174
|
average
|
Theodore Roosevelt
|
178
|
near great
|
Thomas Jefferson
|
189
|
great
|
Ulysses S Grant
|
172
|
failure
|
Warren Harding
|
183
|
failure
|
William Henry Harrison
|
173
|
na
|
William Howard Taft
|
183
|
average
|
William McKinley
|
170
|
average
|
Woodrow Wilson
|
180
|
near great
|
Zachary Taylor
|
173
|
below ave
|
Số liệu tranh cử từ 1789 đến nay là ở đây. Bạn đọc nào có R trong computer, chỉ cần cắt và dán mấy lệnh dưới đây sẽ có kết quả như trong entry trước mà tôi đề cập đến:
year = c(2008, 2008, 2004, 2004, 2000, 2000, 1996, 1996, 1992, 1992,
1988, 1988, 1984, 1984, 1980, 1980, 1976, 1976, 1972, 1972,
1968, 1968, 1964, 1964, 1960, 1960, 1956, 1956, 1952, 1952,
1948, 1948, 1944, 1944, 1940, 1940, 1936, 1936, 1932, 1932,
1928, 1928, 1924, 1924, 1920, 1920, 1916, 1916, 1912, 1912,
1908, 1908, 1904, 1904, 1900, 1900, 1896, 1896, 1892, 1892,
1888, 1888, 1880, 1880, 1864, 1864, 1852, 1852, 1844, 1844,
1840, 1840, 1836, 1836, 1832, 1832, 1828, 1828, 1824, 1824,
1820, 1820, 1816, 1816, 1812, 1812, 1800, 1800, 1796, 1796,
1792, 1792, 1789, 1789)
height = c(187, 167, 180, 193, 180, 184, 189, 183,
189, 188, 188, 167, 185, 180, 185, 175, 175,
185, 182, 185, 182, 180, 192, 183, 183, 182,
179, 178, 179, 178, 175, 173, 188, 173, 188,
185, 188, 173, 188, 180, 182, 168, 178, 183,
183, 168, 180, 180, 180, 178, 182, 183, 178,
183, 170, 183, 170, 183, 180, 168, 168, 180,
183, 188, 192, 168, 178, 196, 173, 185, 173,
168, 168, 173, 185, 185, 185, 170, 170, 185,
183, 170, 183, 178, 163, 191, 189, 168, 170,
189, 188, 170, 188, 170)
won = c(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0)
# kiem tra so lieu
cbind(year, height, won)
# Ve bieu do box
boxplot(height ~ won,
ylab="Chieu cao", xlab="Ket qua (1=thang, 0=thua")
# mo hinh hoi qui logistic
logist = glm(won ~ height, family=binomial)
0 nhận xét:
Đăng nhận xét