Trở về   Nước Nga trong tôi > Nước Nga ngày nay > Đời sống, xã hội Nga

Diễn đàn NuocNga.net
Nội quy diễn đàn
Trang chủ tin tức
Thông báo về kích hoạt tài khoản thành viên

Trả lời
 
Ðiều Chỉnh Xếp Bài
  #61  
Cũ 14-12-2011, 08:55
SSX SSX is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Sep 2011
Bài viết: 1,451
Cảm ơn: 288
Được cảm ơn 1,332 lần trong 674 bài đăng
Default

Trích:
Dmitri Tran viết Xem bài viết
Bác hanoi đi ngủ sớm, tôi đang xem Giải bóng chuyền nữ VĐ các quốc gia châu Âu, nên trả lời hộ. Bác ấy mà tỉnh dậy, 2 người lại "đôi co" nhau làm mất không khí chung trên dđàn.

Đó là họa đồ minh họa cho phân phối của số các điểm bầu cử của từng đảng theo tỷ lệ % số phiếu bầu cho đảng ấy.
Còn kỳ vọng nhận được % phiếu bầu là khái niệm khác. Kỳ vọng toán học E[X] của 1 biến ngẫu nhiên được tính bằng tổng các tích giữa xác suất xảy ra của mỗi giá trị có thể của biến với giá trị đó (Nhớ là biến, chứ không phải giá trị rời rạc như ở đây).

Đây chẳng có hàm và cũng chẳng có biến (Xem thêm khái niệm Số thực, hình như nay lớp 12 đã học rồi thì phải). Đây là họa đồ gồm các điểm trên trục OY - là số các điểm bầu cử, ứng với các điểm trên trục OX - là tỷ lệ theo % số phiếu bầu.
Như vậy, nó là tập hợp các điểm rời rạc, cho nên không phải là hàm số, hay hàm phân phối theo nghĩa chính xác của khái niệm này. Ta nối các điểm đó lại để cho dễ nhìn, dễ nhận dạng phân phối thực chất của nó thôi.
Nhất trí!!! Không có Gauss ở đây.

Trích:
Kóc Khơ Me viết Xem bài viết
He he xem các bác đấu "toán" với nhau mà Kóc thèm quá! Nhớ hồi còn nhỏ đi thực tập hè thu thập số liệu thủy văn về mực nước, tốc độ dòng chảy, độ sâu lấy mẫu, khoảng cách đến mép nước...ở mấy con sông thuộc Moskva gần polygon của trường. Sau đó về lab xử lý, bình sai.. rồi hì hục "chấm chấm" trên giấy "миллиметровка", rồi thì dùng cái "Лекало" lượn các điểm lại cho nó "đẹp" và "thỏa" phân bố .... Em nào lười lo tán mấy iem tóc vàng, ghi chép không cẩn thận, lấy số liệu của nhóm khác, bị chơi khăm khi cho số liệu láu cá thì chỉ có nước "khóc" vì các bước nhảy đột biến... Có điều nếu không "ăn gian" thì các đường cong khó mà "thỏa" được qui luật phân bố gì gì đó!
Đúng như thế bác ạ. Thực ra thì cái môn bác học có thể là thủy văn nhưng cách làm thì là: Lý thuyết xác suất và thống kê;

Thay đổi nội dung bởi: SSX, 14-12-2011 thời gian gửi bài 10:28
Trả lời kèm theo trích dẫn
  #62  
Cũ 14-12-2011, 11:23
Dmitri Tran's Avatar
Dmitri Tran Dmitri Tran is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Dec 2010
Đến từ: Kisinhov-tp HCM
Bài viết: 1,335
Cảm ơn: 2,904
Được cảm ơn 2,884 lần trong 964 bài đăng
Default

Thử tìm hiểu hiểu nguyên nhân của hiện tượng thứ 2 nêu trên:
“đảng Nước Nga thống nhất thắng gần như tuyệt đối tại Bệnh viện tâm thần Moskva!”
Trích:
Мужик viết Xem bài viết
Chắc vì Bệnh viện tâm thần "ăn nên làm ra" trong thời gian NNTN cầm quyền.
Tôi lại nghĩ khác: Người vào bệnh viện tâm thần bao giờ cũng ác cảm và căm thù, từ bác sĩ, nhân viên cho đến tất cả những gì có trong bệnh viện. Nếu thời NNTN “ăn ra làm nên” thì chính họ có tâm lý thù hằn chính quyền hiện tại nhất!

Thời Xô Viết, một trong những điều đáng sợ nhất, nay vẫn còn ám ảnh nhiều người, là những biện pháp áp dụng đối với những người có tư tưởng chống đối. Trong đó, việc áp đặt cho các phần tử đó những triệu chứng bệnh tâm thần và đưa họ vào nhà thương điên để điều trị theo kiễu “lợn lành chữa thành lợn què”. Các phương pháp “điều trị” này, cả cơ học và hóa chất, phải nói là tiên tiến hàng đầu thế giới, được nghiên cứu tại nhiều trung tâm khoa học, và chúng được mô tả không ít trong nhiều sách vở thời đổi mới. Qua tiếp xúc nhiều năm với xã hội, và theo tôi nghĩ, nguyên nhân chính việc Liên Xô sụp đổ nhanh chóng với sự góp sức của đa số dân chúng, không phải vì hệ tư tưởng hay thành tựu đã đạt được (nay người Nga vẫn tự hào về giáo dục và cuộc sống thời Xô Viết), mà vì bóng tối những năm 30 và những biện pháp thiều nhân đạo này. Một người bị đối xữ như vậy, hàng trăm, hàng nghìn người bà con xa gần, bạn bè thân thuộc buộc phải chia sẻ... Gánh nặng tâm lý này lớn lắm!

Ngày nay, các phương pháp đó vẫn dùng ở Nga để chữa trị những người bị tâm thần thực sự. Họ, với tàn dư ác cảm các phương pháp thời Cộng sản trong tiềm thức, nay lại đích thân “nếm mùi” chúng, bản thân suy diễn bị lệch pha vì có” trục trặc” về tâm lý, nên đổ tất cả bất bình vào chế độ cũ, chỉ có chế độ mới đang cầm quyền là tốt nhất!
__________________
Bấm vào ảnh để xem kích cỡ đầy đủ.
Cả thế gian trong tay ta!
Весь мир в наших руках !
Trả lời kèm theo trích dẫn
  #63  
Cũ 14-12-2011, 14:52
hungmgmi's Avatar
hungmgmi hungmgmi is offline
Kvas Nga - Квас
 
Tham gia: Nov 2007
Đến từ: Hà Nội
Bài viết: 6,374
Cảm ơn: 7,948
Được cảm ơn 12,324 lần trong 3,882 bài đăng
Gửi tin nhắn bằng Skype™ tới hungmgmi
Default

Bác KOK làm em nhớ cái hồi đi thực tập môn Trắc địa (Geodezia), cả lũ kéo nhau ra cái công viên gần trường, sát hồ nước. Mấy sinh viên VN và các bạn gái LX cứ nhẩn nha, đo vớ đo vẩn, chơi là chủ yếu. Trong khi đó các tổ khác đo hì hục, hì hục...Cuối cùng, cánh VN ngồi bịa số, ra những biểu đồ cực chuẩn, hợp lý, được điểm cao. Ura!!!!!!!!!!!!!!
__________________
hungmgmi@nuocnga.net
Trả lời kèm theo trích dẫn
  #64  
Cũ 14-12-2011, 16:04
Julia's Avatar
Julia Julia is offline
Cá Vobla - Вобла сушеная
 
Tham gia: Nov 2007
Bài viết: 386
Cảm ơn: 203
Được cảm ơn 378 lần trong 177 bài đăng
Default

Trích:
hungmgmi viết Xem bài viết
Bác KOK làm em nhớ cái hồi đi thực tập môn Trắc địa (Geodezia), cả lũ kéo nhau ra cái công viên gần trường, sát hồ nước. Mấy sinh viên VN và các bạn gái LX cứ nhẩn nha, đo vớ đo vẩn, chơi là chủ yếu. Trong khi đó các tổ khác đo hì hục, hì hục...Cuối cùng, cánh VN ngồi bịa số, ra những biểu đồ cực chuẩn, hợp lý, được điểm cao. Ura!!!!!!!!!!!!!!
Anh Hung cứ đùa. Ở Polygon các điểm mốc (cố định) đều có cao độ sẵn. Các giáo không cho biết, nhưng các ông ấy có đáp án. Nên bịa là không được, anh bịa mà dẫn sai cao độ là ăn đòn.
__________________
THERE IS NO FREE MEAL
Trả lời kèm theo trích dẫn
  #65  
Cũ 14-12-2011, 16:36
Old Tiger's Avatar
Old Tiger Old Tiger is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Jan 2008
Bài viết: 3,326
Cảm ơn: 10,572
Được cảm ơn 10,594 lần trong 2,456 bài đăng
Default

Trích:
Thử tìm hiểu hiểu nguyên nhân của hiện tượng thứ 2 nêu trên:
“đảng Nước Nga thống nhất thắng gần như tuyệt đối tại Bệnh viện tâm thần Moskva!”
Cho nhà em dự quả nhé:

Em nghĩ bầu cử ở bệnh viện tâm thần có lẽ cũng gần giống như bầu cử ở quê em: Ở quê em, một nhà cử một người đi bầu cho tất cả, có khi cho cả hàng xóm, họ hàng... he he!

Còn trong bệnh viện này chắc lại giao phó hết cho một vài bác sỹ mà như lão Mu nói:

Trích:
Мужик viết Xem bài viết
Chắc vì Bệnh viện tâm thần "ăn nên làm ra" trong thời gian NNTN cầm quyền.
Trích:
Dmitri Tran viết Xem bài viết
Thời Xô Viết, một trong những điều đáng sợ nhất, nay vẫn còn ám ảnh nhiều người, là những biện pháp áp dụng đối với những người có tư tưởng chống đối. Trong đó, việc áp đặt cho các phần tử đó những triệu chứng bệnh tâm thần và đưa họ vào nhà thương điên để điều trị theo kiễu “lợn lành chữa thành lợn què”.
Cứ gì thời XV bác ơi! Ở đâu, và thời nào chẳng có.
Trả lời kèm theo trích dẫn
  #66  
Cũ 14-12-2011, 21:32
Kóc Khơ Me's Avatar
Kóc Khơ Me Kóc Khơ Me is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Oct 2009
Bài viết: 1,209
Cảm ơn: 1,928
Được cảm ơn 4,011 lần trong 925 bài đăng
Gửi tin nhắn bằng Yahoo tới Kóc Khơ Me
Default

Trích:
SSX viết Xem bài viết
Nhất trí!!! Không có Gauss ở đây.

Đúng như thế bác ạ. Thực ra thì cái môn bác học có thể là thủy văn nhưng cách làm thì là: Lý thuyết xác suất và thống kê;

hungmgmi: Bác KOK làm em nhớ cái hồi đi thực tập môn Trắc địa (Geodezia), cả lũ kéo nhau ra cái công viên gần trường, sát hồ nước. Mấy sinh viên VN và các bạn gái LX cứ nhẩn nha, đo vớ đo vẩn, chơi là chủ yếu. Trong khi đó các tổ khác đo hì hục, hì hục...Cuối cùng, cánh VN ngồi bịa số, ra những biểu đồ cực chuẩn, hợp lý, được điểm cao. Ura!!!!!!!!!!!!!!

Julia: Anh Hung cứ đùa. Ở Polygon các điểm mốc (cố định) đều có cao độ sẵn. Các giáo không cho biết, nhưng các ông ấy có đáp án. Nên bịa là không được, anh bịa mà dẫn sai cao độ là ăn đòn.
Bonjour (bông-rua) các bác!
Tất cả chúng ta đều có lý, bởi đó là những gì mà mỗi chúng ta đã từng trải qua một cách thực tế bằng chính những nỗ lực của mình cả một thời trai trẻ! Ví dụ thì mộc mạc, môn học thì tầm thường nhưng đã thấm vào cơ thể từ lúc nào chẳng rõ, để khi gặp lúc là tự động bật ra một cách chân thành.

Điều bật ra này cũng có thể làm cho ai đó "sực nhớ" lại những điều căn bản trong cuộc sống: phải thật tình nhưng cũng phải dùng đến thước "cong" một cách thích hợp chứ không được dùng thước "thẳng" một cách giản đơn để che dấu một sự "cong"...

Sau đây là người Nga nói về cái đồ thị này, bác nào phiên hộ "ý" ra tiếng Việt thì Kóc cám ơn lắm!

Thời sự nhất là ông này:
Одни грамотеи рисуют кривые, другие их опровергают.
А нужны кривые, чтобы доказать рост цен на нашем пермском рынке?
Я помню не так уж давнее время, когда грудинка для супа стоила 35-40 руб. за кг. Три месяца назад она стоила 170 руб., месяц назад - 190, в эту субботу (день митинга) - 200 руб. Могу и без кривых и Гауссов безошибочно предположить, что к Новому Году она выйдет на 210-220 руб., и после Нового Года цена не упадет.
Ау, математики-статистики, опровергайте.
Аналогично стоимость услуг ЖКХ, цены на лекарства, автомобили, железнодорожные билеты и взятки врачам, учителям, чиновникам и гаишникам.
А теперь нарисуйте кривую роста пенсий и зарплат по стране. И докажите, что вторая кривая кривее первой кривой.
Можно еще нарисовать кривые падений российских самолетов и космических ракет.
Кривые пожаров в старых бараках - домах престарелых. Кривые продажи сирот (откуда они берутся?) из России в США и другие страны, где сирот почему-то нет.
Кривую убийств на душу населения (в 15 раз больше, чем в Европе, в 5 раз больше, чем в США), причем не считая "пропавших", которые в большинстве в лесочке закопаны.
А народ щяслив и единодушно голосует за ЕР - "ум, честь и совесть нашей эпохи". И Чуров безошибочно подводит итоги этого щястя.

Слава высокомудрым математикам, умеющим кривые рисовать!
Клоуны.


Ông này thì chửi đổng:
Ничего особенного эти графики не показывают
Ничего странного не вижу, что количество голосов за ЕР увеличивается с увеличением явки. Ведь ЕР - партия власти на данный момент, а там, где люди властью довольны, там и явка выше. Приходят и голосуют. А естественно там где не очень довольны - могут просто не появиться, вместо того чтобы за альтернативные партии голосовать. У нас вот тоже в Казахстане президента выбирали - явка почти стопроцентная и все за одного А вообще, надо законодательно закрепить - не явился на выборы - голос автоматически к текущей партии власти переходит. Это логично - если не хочешь ничего менять, значит нравится как сейчас есть. А если не доволен так будь добр хотя бы в день выборов попу от кресла оторвать. Вот тогда не будет в Интернете информационных вбросов наподобие этой статьи.


Ông này lại thật tình!
Ерунда. Предпочтения избирателей ложатся в нормальное распределение только в целом по стране. Если брать отдельные участки распределение не может быть нормальным - в разных местах у людей совершенно разные предпочтения.
.....

Cũng cần phải nói thêm rằng các biểu đồ tương tự của các cuộc bầu cử Duma và Tổng thống ở Nga từ năm 2005, 2008, 2009 đều có dạng như thế đối với các đảng phái, kể cả các bước nhảy tại các vị trí chẵn 5%. Có lẽ là do ý đồ lập ra từ trước!
__________________
На свете нет вечного двигателя, зато есть вечные тормоза...
Album Скучаю по России
Trả lời kèm theo trích dẫn
  #67  
Cũ 14-12-2011, 22:41
hanoi hanoi is offline
Thịt nướng Nga - Шашлык
 
Tham gia: Nov 2009
Bài viết: 451
Cảm ơn: 54
Được cảm ơn 650 lần trong 276 bài đăng
Default

Tôi đã bỏ ít thời gian tìm hiểu xem bằng cách nào họ có được dữ liệu kể trên. Dữ liệu đó đã được download tự động bằng script viết bằng Python. Ai quen biết với Python sẽ biết đoạn script kể trên làm những công việc gì. Đoạn script này tự động download dữ liệu trên trang web của ủy ban bầu cử có địa chỉ tại http://www.vybory.izbirkom.ru. Dữ liệu sau khi thu thập được đã được công bố rộng rãi và có thể download tự do tại đây.

Tôi đã download dữ liệu này về, nó khá lớn, chứa trong file excel khoảng 38 MB, mỗi dòng trên file excel là tương ứng với dữ liệu của một điểm bầu cử, có tất cả 95067 dòng như vậy tương ứng với 95067 điểm bỏ phiếu. Mỗi dòng có url dẫn đến địa chỉ download dữ liệu của dòng đó vì vậy có thể suy ra được dữ liệu đó đến từ điểm bầu cử nào. Ví dụ dòng thứ nhất là dữ liệu của điểm bầu cử này là lấy từ địa chỉ sau. Tổng số phiếu bầu hợp lệ cho tất cả các đảng là 64547277 trong file kể trên là. Dữ liệu này được thu thập khi đã có hơn 99% số điểm bỏ phiếu đã hoàn tất kiểm phiếu vì vậy có độ lệch so với con số cuối cùng một chút (64623062 lá phiếu). Ai quan tâm có thể kiểm tra sơ bộ các con số trên file Excel kể trên với con số cuối cùng của ủy ban bầu cử tại đây.

Tôi đã viết script ngắn để xử lý file excel kể trên rồi vẽ lại đồ thị đúng như mô tả của tác giả kể trên. Và đây là kết quả mà tôi thu được, hình vẽ dùng bin-size đúng như mô tả tức là 0.5 %. Tôi cũng công bố dữ liệu mà tôi extract từ file excel để vẽ cái hình này ở phần cuối bài, bác nào thích có thể import cái file này vào Matlab vẽ lại để kiểm chứng. Khi vẽ hình lưu ý set range cho y-axis chỉ từ 0-3000, nằm ngoài khoảng này hình dạng phần phía dưới rất nhỏ ko nhìn thấy rõ.

Bấm vào ảnh để xem kích cỡ đầy đủ.

Nếu hình ko được rõ các bác có thể nhấn vào hình để xem kích thước lớn hơn.

Từ hình vẽ mà tôi vẽ lại kể trên có thể khẳng định rằng hình vẽ của tôi và của tác giả nọ được vẽ cùng một nguồn gốc kể trên. Cũng cần phải kiểm chứng lại xem là dữ liệu kể trên có được download toàn bộ và chính xác từ trang web bầu cử hay là ko.


************************************************** ****
% CP LDPR PR KPRF Yabloko EP PD
0.0 5817 6096 31436 1687 26117 53 53596
0.5 1587 1881 24101 828 11717 3 26097
1.0 1311 1489 21121 884 10096 1 9762
1.5 1065 1248 10810 708 7764 0 2971
2.0 1078 1126 4137 734 6120 0 1097
2.5 1034 1069 1561 740 4989 0 502
3.0 1187 1030 706 661 4028 0 278
3.5 1072 1060 360 653 3285 2 176
4.0 1154 1079 216 722 2987 4 102
4.5 1150 1117 131 729 2466 0 91
5.0 1342 1180 103 800 2190 3 61
5.5 1487 1227 72 735 1735 5 67
6.0 1489 1349 57 813 1511 6 42
6.5 1569 1408 34 833 1261 1 35
7.0 1695 1586 43 849 1069 9 31
7.5 1799 1660 42 1042 928 1 24
8.0 1928 1796 23 1077 826 5 16
8.5 1956 1766 16 1064 707 0 10
9.0 2092 2104 17 1171 622 12 18
9.5 2009 2132 8 1076 502 1 8
10.0 2286 2400 9 1355 505 24 8
10.5 2232 2441 3 1272 390 5 8
11.0 2492 2535 0 1352 369 11 6
11.5 2447 2622 3 1427 332 4 4
12.0 2466 2746 4 1345 282 8 7
12.5 2488 2904 9 1582 268 17 7
13.0 2517 2906 4 1541 235 9 1
13.5 2576 2916 3 1657 212 6 0
14.0 2627 2953 4 1719 204 25 5
14.5 2494 2882 3 1776 149 9 2
15.0 2447 2950 2 1903 127 23 3
15.5 2372 2786 3 1854 123 17 1
16.0 2263 2668 2 2040 112 30 3
16.5 2173 2477 3 2094 96 46 4
17.0 2050 2349 0 2068 98 47 2
17.5 2005 2255 1 2148 68 65 2
18.0 1902 1995 3 2093 66 86 2
18.5 1757 1813 1 1954 55 93 1
19.0 1629 1672 1 2070 48 136 2
19.5 1453 1464 0 1830 44 122 0
20.0 1420 1500 1 2099 52 183 2
20.5 1262 1239 0 1884 34 203 1
21.0 1160 1074 2 1852 31 259 0
21.5 1075 976 1 1801 28 319 0
22.0 929 873 2 1774 22 367 0
22.5 943 756 0 1770 22 419 0
23.0 839 681 2 1828 26 446 0
23.5 730 542 0 1741 16 570 0
24.0 701 515 0 1756 11 570 0
24.5 622 418 0 1542 11 577 1
25.0 646 457 1 1771 11 703 0
25.5 547 334 0 1658 11 792 0
26.0 504 273 0 1574 3 798 0
26.5 462 280 0 1536 1 840 1
27.0 449 220 2 1432 5 877 1
27.5 420 211 0 1325 3 907 2
28.0 394 171 0 1308 2 940 0
28.5 353 157 1 1155 6 958 0
29.0 323 123 0 1084 3 984 0
29.5 324 96 0 1014 4 947 0
30.0 298 119 0 1022 0 961 0
30.5 258 78 0 897 4 1014 0
31.0 241 69 0 841 1 1009 0
31.5 230 58 0 757 7 928 0
32.0 193 54 0 697 2 1021 0
32.5 185 63 0 623 2 991 0
33.0 164 77 0 572 1 1028 1
33.5 128 28 0 510 3 979 1
34.0 100 37 0 459 0 1000 0
34.5 90 27 0 431 4 980 0
35.0 90 33 0 412 2 1007 0
35.5 65 35 0 333 4 1007 0
36.0 44 26 0 298 1 946 0
36.5 44 20 0 268 1 922 0
37.0 41 18 0 254 2 927 0
37.5 45 24 0 226 2 944 0
38.0 28 23 0 172 0 945 0
38.5 23 7 0 179 2 910 1
39.0 24 9 0 133 2 935 0
39.5 14 10 0 91 1 918 0
40.0 30 13 0 131 1 1050 0
40.5 8 10 0 108 0 930 0
41.0 14 7 0 92 1 970 0
41.5 13 5 0 78 1 928 0
42.0 5 14 0 55 1 880 0
42.5 7 12 0 72 1 934 0
43.0 8 6 0 71 0 894 0
43.5 9 5 0 52 2 882 0
44.0 7 13 0 47 2 909 0
44.5 6 3 0 42 0 860 0
45.0 7 14 0 40 1 843 0
45.5 3 4 0 21 0 813 0
46.0 2 4 0 23 0 898 0
46.5 2 4 0 23 0 868 0
47.0 4 7 0 15 1 881 0
47.5 3 1 0 19 0 818 0
48.0 2 9 0 17 1 856 0
48.5 0 1 0 15 0 867 0
49.0 4 0 0 13 0 759 0
49.5 0 1 0 5 0 608 0
50.0 8 23 0 26 0 958 0
50.5 0 1 0 7 0 826 0
51.0 0 3 0 11 0 821 0
51.5 2 3 0 4 1 853 0
52.0 1 2 0 7 0 849 0
52.5 1 0 0 9 0 790 0
53.0 0 2 0 6 0 790 0
53.5 0 6 0 6 0 769 0
54.0 0 0 0 4 0 741 0
54.5 1 5 0 7 0 744 0
55.0 0 2 0 3 0 786 0
55.5 2 0 0 8 0 691 0
56.0 0 0 0 3 0 762 0
56.5 1 1 0 2 0 705 0
57.0 0 2 0 1 0 710 0
57.5 0 0 0 4 0 644 0
58.0 0 1 0 3 0 702 0
58.5 0 1 0 1 0 606 0
59.0 0 0 0 2 0 628 0
59.5 0 0 0 1 0 501 0
60.0 3 6 0 4 1 703 1
60.5 0 1 0 3 0 560 0
61.0 0 1 0 3 0 609 0
61.5 0 1 1 0 0 581 0
62.0 0 0 0 0 0 523 0
62.5 1 1 0 2 0 597 1
63.0 0 1 0 1 1 575 0
63.5 0 3 0 2 0 540 0
64.0 0 0 0 1 0 466 0
64.5 0 0 0 0 0 498 0
65.0 0 0 0 1 0 602 0
65.5 0 0 0 1 0 566 0
66.0 0 0 0 3 0 517 0
66.5 2 4 0 0 0 449 0
67.0 0 0 0 0 0 487 0
67.5 0 1 0 3 0 443 0
68.0 0 0 0 1 0 463 0
68.5 0 0 0 0 0 432 0
69.0 1 0 0 0 0 445 0
69.5 0 1 0 0 0 432 0
70.0 2 1 0 1 0 556 0
70.5 0 0 0 0 0 480 0
71.0 0 0 0 0 0 445 0
71.5 0 1 0 0 1 412 0
72.0 0 1 0 1 0 419 0
72.5 0 1 0 0 0 391 0
73.0 0 0 0 0 0 373 0
73.5 0 0 0 0 0 327 0
74.0 0 0 0 1 0 350 0
74.5 0 0 0 0 0 345 0
75.0 0 0 0 7 0 527 0
75.5 0 0 0 0 0 343 0
76.0 0 0 0 0 0 320 0
76.5 0 0 0 0 0 307 0
77.0 0 0 0 0 0 278 0
77.5 0 1 0 2 0 244 0
78.0 0 0 0 0 0 273 0
78.5 0 0 0 1 0 262 0
79.0 0 0 0 0 0 248 0
79.5 0 0 0 1 0 267 0
80.0 0 2 0 1 0 369 0
80.5 0 0 0 0 0 308 0
81.0 0 0 0 1 0 278 0
81.5 0 0 0 0 0 264 0
82.0 0 0 0 0 0 259 0
82.5 0 0 0 0 0 266 0
83.0 0 0 0 1 0 243 0
83.5 0 0 0 0 0 223 0
84.0 0 0 0 0 0 228 0
84.5 0 0 0 0 0 236 0
85.0 0 0 0 0 0 354 0
85.5 0 0 0 0 0 237 0
86.0 0 0 0 0 0 223 0
86.5 0 0 0 0 0 209 0
87.0 0 0 0 0 0 208 0
87.5 0 0 0 0 0 214 0
88.0 0 0 0 0 0 190 0
88.5 0 0 0 0 0 197 0
89.0 0 0 0 0 0 199 0
89.5 0 0 0 0 0 229 0
90.0 0 0 0 0 0 354 0
90.5 0 0 0 0 0 316 0
91.0 0 0 0 0 0 327 0
91.5 0 0 0 0 1 326 0
92.0 0 0 0 0 1 311 0
92.5 0 0 0 0 0 304 0
93.0 0 0 0 0 0 267 0
93.5 0 0 0 0 0 271 0
94.0 0 0 0 1 0 300 0
94.5 0 0 0 0 0 343 0
95.0 0 0 0 0 0 451 0
95.5 0 0 0 0 0 298 0
96.0 0 0 0 0 0 340 0
96.5 0 0 0 0 0 292 0
97.0 0 0 0 0 0 316 0
97.5 0 0 0 0 0 302 0
98.0 0 0 0 0 0 396 0
98.5 0 0 0 1 0 363 0
99.0 0 0 0 0 0 610 0
99.5 0 0 0 0 0 389 0
Trả lời kèm theo trích dẫn
Có 2 thành viên gửi lời cảm ơn hanoi cho bài viết trên:
Nina (16-12-2011), ninh (15-12-2011)
  #68  
Cũ 14-12-2011, 23:09
Nina Nina is offline
Kvas Nga - Квас
 
Tham gia: Nov 2007
Đến từ: TPHCM
Bài viết: 6,416
Cảm ơn: 5,003
Được cảm ơn 8,268 lần trong 3,723 bài đăng
Default

Bạn hanoi ạ, tôi không nghi ngờ bộ số liệu của bạn. Trước hết tôi muốn hỏi - tại sao chúng ta lại có thể nối những điểm trên, và tại sao giả thuyết phân bố Gauss lại áp dụng ở đây. Và bạn có thể giải thích xem cái đường cong ứng với đảng Yabloko là đường gì vậy?
Trả lời kèm theo trích dẫn
  #69  
Cũ 14-12-2011, 23:49
hanoi hanoi is offline
Thịt nướng Nga - Шашлык
 
Tham gia: Nov 2009
Bài viết: 451
Cảm ơn: 54
Được cảm ơn 650 lần trong 276 bài đăng
Default

Trích:
Nina viết Xem bài viết
Bạn hanoi ạ, tôi không nghi ngờ bộ số liệu của bạn. Trước hết tôi muốn hỏi - tại sao chúng ta lại có thể nối những điểm trên, và tại sao giả thuyết phân bố Gauss lại áp dụng ở đây. Và bạn có thể giải thích xem cái đường cong ứng với đảng Yabloko là đường gì vậy?
Tôi ko biết chị hiểu cái biểu đồ này như thế nào vì câu hỏi của chị "tại sao chúng ta lại có thể nối những điểm trên" cho thấy chị chưa có đọc kỹ bài của bác Dmitry Nguyễn, bác Ninh và bác ngbinhdi cũng như bài của tôi. Vẽ như thế nào thì tôi đã lấy dữ liệu, vẽ lại rồi đó. Cái hình tôi vẽ là hình do chính tôi tự tay lập trình từ dữ liệu thô rồi plot lại đấy, tôi cũng in ra dữ liệu mà tôi dùng để vẽ cái hình đó ở bài trước đấy, chị thích thì có thể lấy mà vẽ lại.

Về câu hỏi tại sao định luật Gaussian áp dụng ở đây thì tôi khẳng định như thế này (đã khẳng định ở bài trước) là tôi nghi ngờ kết luận này của tác giả, tôi chỉ đặt câu hỏi nghi ngờ lớn nhất ở các điểm răng cưa xuất hiện đồng đều trên hình vẽ mà thôi. NẾu chị ko có ý kiến gì hay phản bác lại các hình răng cưa rất đẹp và đều này thì cứ nói ra cho mọi người học hỏi, chứ chị với tư cách là MOD diễn đàn mà nói chuyện cứ úp úp mở mở tôi thấy rất kỳ cục.

Tôi chủ yếu làm việc với xây dựng mô hình cho dữ liệu, vì vậy tôi khẳng định rằng ko ai có thể nói chắc nịch rằng "dữ liệu này tuân theo hàm phân bổ nọ với xác xuất 100%" trừ khi dữ liệu đó là synthetic do con người tạo ra bằng máy tính thì nó fit 100% với phân bổ định trước. Phần lớn dữ liệu thu thập thực tế rất nhiễu do vậy khi nhìn dạng của đồ thị người ta sẽ dùng trực quan để lựa chọn cho mình những phân bổ chuẩn mặc để rồi dùng các công cụ model fitting của statistics để tìm các parameters của mô hình kể trên. Nhiều loại dữ liệu có hình bell-shape thường được ví với Gaussian hoàn toàn bằng trực quan và vì vậy họ sẽ tìm cách fit dữ liệu đó với Gaussian. Nếu Gaussian ko hoạt động tốt họ có thể dùng các mô hình phức tạp hơn như mixture of Gaussian hoặc thậm chí những mô hình cực kỳ phức tạp với số parameter rất lớn như mạng neutron.

TRong hình vẽ kể trên có 3 đồ thì ko có hình bell-shape đó là những đồ thị của các đảng dành được rất ít số phiếu, nhiều nhất là đảng Yabloko với 3% số phiếu. Nếu được chọn mô hình cho 3 đồ thì này thì tôi sẽ ko dùng Gaussian mà sẽ dùng Pareto distribution . Đây là dạng distribution cũng rất phổ biến tuân theo luật 80/20 khi 20% ngời giàu có lấy đi 80% của cải và ngược lại. Tôi cũng ko hiểu tại sao 3 đảng này lại có distribution khác hẳn với 4 đảng còn lại.
Trả lời kèm theo trích dẫn
Được cảm ơn bởi:
Julia (15-12-2011)
  #70  
Cũ 15-12-2011, 10:42
Julia's Avatar
Julia Julia is offline
Cá Vobla - Вобла сушеная
 
Tham gia: Nov 2007
Bài viết: 386
Cảm ơn: 203
Được cảm ơn 378 lần trong 177 bài đăng
Default

Trích:
hanoi viết Xem bài viết
Chị hiểu cái biểu đồ đó như thế nào nói ra xem nào, cứ úp úp mở mở chả hiểu chị muốn điều gì. Làm người thì phải ngay thẳng, tranh luận để tìm ra sự thật chứ chẳng phải để chứng minh ai đúng ai sai.
Em đánh giá cao cách thức tranh luận của anh Hanoi, mạng đậm dấu ấn của người nghiên cứu khoa học. Thậm chí anh còn bỏ công vẽ lại đồ thị. Tuy nhiên, liệu có cần thiết phải dùng những lời lẽ như thế này không? Nếu không muốn trả lời thì thôi vì chị Nina cũng chỉ hỏi cặn kẽ có ý gì đâu. Em biết chị Nina cũng rất giỏi toán. Điều gì làm anh nổi khùng lên như vậy. Nhiều cũng phải biết kiểm soát bản thân.
__________________
THERE IS NO FREE MEAL

Thay đổi nội dung bởi: Julia, 15-12-2011 thời gian gửi bài 10:45
Trả lời kèm theo trích dẫn
Có 3 thành viên gửi lời cảm ơn Julia cho bài viết trên:
hanoi (15-12-2011), hungmgmi (15-12-2011), Nina (19-12-2011)
  #71  
Cũ 15-12-2011, 12:10
Dmitri Tran's Avatar
Dmitri Tran Dmitri Tran is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Dec 2010
Đến từ: Kisinhov-tp HCM
Bài viết: 1,335
Cảm ơn: 2,904
Được cảm ơn 2,884 lần trong 964 bài đăng
Default

Các bác bàn luận chi tiết và hăng say quá (trong đó có các chổ “răng cưa” dị thường là 1 ẩn số khó hiểu) làm tôi cũng bị lây theo. Anh bạn vừa gửi cho tôi bài:
Nghiên cứu kết quả bầu cử Duma 2011 dựa trên Thống kê Toán học.
Tác giả: nhà Vật lý lý thuyết Sergey Spilkin.
Cũng là nhờ “máu” nghề nghiệp, tôi chịu khó trích dịch chi tiết và có giải thích thêm để mọi người cùng theo dõi.

I . Khái niệm chung. Ta hãy xem, tại sao số cư tri đi bầu, tỷ lệ % bầu cho ứng cử viên trong bất kỳ một cuộc bầu cử nào đều phân bố theo phân phối chuẩn hoặc gần chuẩn?
Để dễ hình dung về Luật số lớn trong Lý thuyết XS, ta xét VD tung đồng tiền. Ai cũng biết, XS để mặt có chữ số nằm trên là 50% (hay là 0,5), nhưng không có nghĩa là: cứ tung 100 lần chẳng hạn thì mặt chữ số nằm trên đúng 50 lần. Nhưng nếu ta làm thí nghiệm rất nhiều lần, 450 lần chẳng hạn, trong mỗi thí nghiệm ta tung đồng tiền 100 lần, và lập Biểu đồ phân bố kết quả số lần xuất hiện mặt chữ số (trục ngang OX) ứng với số lần làm thí nghiệm (trục đứng OY) thì nó có dạng sau:

Bấm vào ảnh để xem kích cỡ đầy đủ.

Vì số lần xuất hiện mặt chữ số là Đại lượng ngẫu nhiên nên biểu đồ không là đường cong trơn. Nếu ta lặp lại những thí nghiệm này vào 1 lúc khác thì con số chính xác có thể khác chút ít, nhưng dạng tổng quát của chúng có dạng như trên. Đường cong này là độ thị của Phân phối chuẩn (Gauss) có dạng hình Chuông, và nó đã được nghiên cứu rất nhiều và kỹ trong Lý thuyết XS. Trong tự nhiên, pph. chuẩn rất đặc trưng cho rất nhiều đại lượng khi chúng phụ thuộc vào nhiều yếu tố ngẫu nhiên, Việc tung đồng tiền là 1 VD.
Nếu ta xét trên phạm vi cả nước thì sự có mặt của cử tri tại điểm bầu cử, tỷ lệ % phiếu bầu cho ứng cử viên cũng là các đại lượng ngẫu nhiên, nếu mỗi người tự đi đến điểm bầu cử không bị ai lôi kéo và họ tự mình quyết định khi bỏ phiếu mà không bị tác động bên ngoài.

II. Tại các điểm với số người đi bầu đông có sự tăng đột biến số lượng phiếu bầu, không phù hợp quy luật tự nhiên,
Ta lập biểu đồ bầu cử. Vì số lượng các đại lượng ngẫu nhiên (tức là mỗi cử tri) quá lớn, đến hàng triệu, nên ta ra từng khoảng để dễ vẻ. Xem Biểu đồ bầu cử ở 1 số nước: Trục OX chỉ số người đi bầu với khoảng chia rộng 5%, trục OY – số lượng điểm bầu cử.

Bấm vào ảnh để xem kích cỡ đầy đủ.
]

Màu nâu - Mexico, bầu Quốc hội năm 2009
Màu xanh đậm – Bungaria, bầu Quốc hội năm 2009,
Màu vàng – Ba Lan, bầu Tổng thống năm 2010,
Màu xanh lá cây – Ukraina, bầu Tổng thống năm 2010.
Tất cả các nước đều có pph dạng rất gần với pph chuẩn và khá đối xứng qua trục thẳng đứng. Sai số độ lệch này áng không quá 2%.
Còn dạng của biểu đồ cuộc bầu cử Viện Duma vừa rồi ở LB Nga (người đi bầu và số điểm bầu) có dạng khác hẳn, hoàn toàn không có dính líu gì đến dạng chuẩn.

Bấm vào ảnh để xem kích cỡ đầy đủ.

Màu xanh lá cây – Bầu Tổng thống ở LB Nganăm 2008,
Màu tím – Bầu Duma ở LB Nganăm 2007,
Màu lam – Bầu Duma ở LB Nganăm 2011.
Ta thấy mấy điểm đặc biệt sau ở LB Nga:
1. Pph của LB Nga hoàn toàn không là dạng pph chuẩn. Như vậy, hoặc là các quy luật kinh tế xã hội của Nga khác hẳn so với thế giới (tức là sự phát triển đất nước nói chung là “không bình thường” so với xã hội loài người), hoặc việc bầu cử của ngươi dân có sự can thiệp của các yếu tố bên ngoài.
2. Pph số lượng điểm bầu ứng với số người đi bầu không có dạng hình Chuông như của các nước ngoài. Ở những điểm có số người đi bầu cao, đồ thị không thu hẹp lại để có dạng đối xứng với các điểm bầu có ít người bỏ phiếu. Nói cách khác là: Số lượng các điểm bầu có số người bầu cử đông đã được tăng lên ngoài quy luật chung.
3. Pph có đường răng cưa rất rõ ở những giá trị chia các khoảng (là bội số của 5%). VD bầu TT năm 2008, số điểm bầu cử có 79% người đi bầu là 1429, đến số điểm bầu cử có 80% - 2069l 81% - 1787.
Như vậy, việc tăng đột ngột những điểm có tỷ lệ người đi bầu cao, trừ một vài trường hợp đặc biệt theo đặc thù của vùng hay dân tộc, trên bình diện toàn quốc là có tính chất nhân tạo. Nó được ghi thêm bằng tay vào kết quả bầu cử nhằm thêm phiếu cho ứng cử viên hay một đảng nào đó.
4. Tại các điểm cực đại của 3 biểu đồ trên thì cuộc bầu cử Viện Duma 2011 vừa rồi có “độ phình”bất thường bé nhất. Chẳng lẻ việc can thiệp bên ngoài vào kiểm phiếu bầu trong 2 kỳ bầu cử trước lớn hơn bây giờ? Và việc này có tính chất truyền thống ở LB Nga trong 2 thập kỹ đổi mới gần đây?

III. Sự ghi thêm phiếu bầu cho NNTN lấy từ các đảng khác.
Để thấy rõ hơn, ta lập biểu đồ bầu cử 2011 theo thông số khác. Trục OX - tỷ lệ % phiếu bầu cho từng đảng (độ lớn khoảng chia là 5%), OY – số lượng điểm bầu cử có % số phiếu tương ứng.

Bấm vào ảnh để xem kích cỡ đầy đủ.

Màu lam – đảng NNTN,
Màu đỏ – ĐCS,
Màu tím – đảng “Nước Nga công bằng”,
Màu nâu – đảng Dân chủ tự do.

Biểu đồ của đảng NNTN chỉ hơi giống dạng chuẩn ở phần đầu bên trái cho đến đỉnh cực đại. Nhánh phải kéo dài 1 cách không tự nhiên cho đến 100%; tại các điểm giao các khoảng (có bội số 5%) các đỉnh nhảy vọt của “răng cưa” cho thấy số lương các điểm bầu được ghi thêm. Và việc ghi thên này được thực hiện khá khéo léo để đạt mức cần thiết mà không đến mức phi lý so với lý thuyết (khi đó biểu đồ sẽ có dạng hình nấm, trên to dưới nhỏ) chứng tỏ động tác này được thực hiện sau khi đã mở thùng phiếu có kết quả thực tế, và việc thêm đồng đều cho thấy tính công nghệ của nó trên phạm vi cả nước.
Mặt khác, biểu đồ của các đảng khác (ĐCS, “Nước Nga công bằng”, Dân chủ tự do) khá giống với pph chuẩn nếu không kể đến sự tăng vọt của số lượng các điểm bầu khi họ nhận được tỷ lệ % thấp (phân đầu của nhánh trái). Riêng ở biểu đồ ĐCS, đỉnh cực đại không “tụ” lại mà bị trãi rộng ra đã xác nhận số lượng lớn đơn của nhiều quan sát viên ĐCS tố cáo việc lấy phiếu của họ ghi thêm cho đảng NNTN.

Tóm lại, chỉ có duy nhất biểu đồ của đảng NNTN là khác hẳn với pph chuẩn.
Để thấy rõ hơn về số lượng của sự “can thiệp” có lợi cho đảng này so với các đảng còn lại, ta lập thêm 1 loại biểu đồ nữa. Trên trục OX – số lượng người đi bầu với dộ lớn khoảng chia là 5%, trục OY – số lượng phiếu bầu tại các điểm bầu cử tương ứng với khoảng chia 1%:

Bấm vào ảnh để xem kích cỡ đầy đủ.

Các màu từ trên xuống dưới: Lam – NNTN; Đỏ vàng – ĐCS; Tím – “NN công bắng”; Nâu – DC Tự do; Lá cây – “Quả Táo”; Vàng – “Người Nga yêu nước”; Đen – “Việc chính nghĩa”
Dạng biểu đồ của NNTN khác hẳn, còn của tất cả các đảng còn lại đều rất giống nhau. Và dễ thấy, số lượng người đi bầu càng cao thì tỷ lệ % phiếu cho NNTN càng lớn hơn so với các đảng khác.

IV. Thử đánh giá “thành quả” của sự ghi thêm đó.
Nếu coi việc phân bố tỷ lệ % phiếu của NNTN tuân theo dạng chung của các đảng khác (tức là không có sự can thiệp bên ngoài), dùng các biểu đồ trên, ta thử tách trong tỷ lệ % phiếu cho NNTN phần tỷ lệ thuận với tổng số phiếu bầu cho tất cả các đảng còn lại (tức là phần “đúng ra” là NNTN sẽ có trên thực tế):

Bấm vào ảnh để xem kích cỡ đầy đủ.

Màu Cỏ úa – số phiếu của tất cả các đảng không kể NNTN;
Xanh nhạt – Phần phiếu của NNTN mà tỷ lệ thuận với tổng số phiếu bầu cho tất cả các đảng còn lại;
Màu Lam – Số lượng phiếu bầu của NNTN;
Màu Tím – Phần “kỳ dị” trong số phiếu bầu cho NNTN.

Sơ bộ nhận xét:
Tại những điểm bầu ít người tham gia (có dưới 50-52 %) đường “kỳ dị” màu Tím gần như bằng 0. Điều này có nghĩa là: Hầu như không có việc ghi thêm phiếu cho NNTN tại những điểm bầu này. Nó phù hợp với sự gần pph chuẩn của nhánh trái trong biểu đồ của NNTN nêu trên. Sự phù hợp này cho thấy tính hợp lý và xác đáng của phương pháp nghiên cứu đang tiến hành.
Sau 52 % số lượng người đi bầu, phần “kỳ dị” màu Tím tăng dần và đạt cao điểm ở những điểm bầu có gần 100 % người đi bỏ phiếu.

Nếu lấy kết quả công bố trừ đi phần “kỳ dị” này thì ta sẽ có đánh giá bằng lượng sự ghi thêm cho đảng NNTN. Và như vậy, khi loại bỏ được phần ghi thêm, ta có thể “phục hồi” lại kết quả thực tế của cuộc bầu Duma vừa rồi:

Bấm vào ảnh để xem kích cỡ đầy đủ.

(Cột bên trái: Số liệu công bố chính thức; Cột phải: Số liệu sau khi hiệu chỉnh bằng phương pháp này)

P.S. @Bác OT. Rất có thể bác sĩ, nhân viên bầu hộ. Nhưng việc đó dính đến tội hình sự và dễ phát giác. Nhẹ nhàng hơn là dùng các máy tâm lý tác động lên ý chí, tình cảm của con người. Chục năm trước, ở Nga và Mỹ đã chế tạo thí nghiệm các phiên bản đầu tiên, có thể tác động tâm lý trong vòng 1 km.
__________________
Bấm vào ảnh để xem kích cỡ đầy đủ.
Cả thế gian trong tay ta!
Весь мир в наших руках !
Trả lời kèm theo trích dẫn
Có 5 thành viên gửi lời cảm ơn Dmitri Tran cho bài viết trên:
природа (18-01-2012), hanoi (15-12-2011), ninh (15-12-2011), Old Tiger (16-12-2011), phuongnn (15-12-2011)
  #72  
Cũ 15-12-2011, 13:45
ninh's Avatar
ninh ninh is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Mar 2008
Đến từ: TP HCM
Bài viết: 664
Cảm ơn: 1,888
Được cảm ơn 1,460 lần trong 474 bài đăng
Default

Xin cảm ơn bác Dmitri Tran đã cất công lược dịch một bài viết khá dài của một tác giả hàng sao. Tuy nhiên, đọc xong tôi thấy không có ý gì mới hơn so với bài Математика выборов mà tôi giới thiệu ở post#50 tại trang 3 của topic này. Ngược lại, sơ lược hơn và có chủ ý nào đó. Chẳng hạn, để tìm hiểu phần đuôi cao và nhiều đỉnh ở giá trị bội 5% của NNTN (xin lỗi bác Gà mờ, dù bác ăn với Nước Nga Trong Tôi, ngủ với Nước Nga Trong Tôi, nhưng đừng hoa mắt nhìn nhầm NNTN thành Nước Nga Trong Nó), tác giả bài báo đó có so sánh giữa 2 hình thức xử lý phiếu bầu - с КОИБ и без КОИБ ( hệ thống kiểm phiếu + thống kê tự động giống như máy chấm bài thi trắc nghiệm và không có), qua đó quy lỗi chủ yếu cho việc xử lý bằng mắt và tay! Biết đâu, mấy ông tướng xử lý bằng tay ở vùng thưa dân lại thiên vị cho NNTN, đồng thời ngại chia đến số lẻ nên cứ lấy 0.7, 0.75, 0.8, ... cho nó gọn!? Còn trong bài bác dịch thì cứ như là có sự chỉ đạo cấp TW cho việc đánh cắp phiếu bầu, nghe khủng khiếp quá.
Thôi, theo gương cụ Dị, em buông!
__________________
Không mua hàng tiêu dùng của Trung Quốc, Đài Loan!
Trả lời kèm theo trích dẫn
  #73  
Cũ 15-12-2011, 14:11
Nina Nina is offline
Kvas Nga - Квас
 
Tham gia: Nov 2007
Đến từ: TPHCM
Bài viết: 6,416
Cảm ơn: 5,003
Được cảm ơn 8,268 lần trong 3,723 bài đăng
Default

Bác Dmitri Tran có thể dịch luôn bài báo của ông Churov về thống kê phân bố phiếu bầu trong đợt bầu cử tổng thống năm 2008 được không ạ?

Ngoài ra, về mặt ngôn ngữ, em kính đề nghị bác nên dùng chữ "phân bố Gauss" thay cho phân bố chuẩn. Vì đối với nhiều người, gọi là phân bố chuẩn khiến cho người ta nghĩ rằng, mọi phân bố khác đều là không chuẩn, không bình thường, là dấu vết của gian lận, vân vân.

Còn câu hỏi về những đường răng cưa ở các vị trí "đẹp" em sẽ trả lời trong tối nay.
Trả lời kèm theo trích dẫn
Được cảm ơn bởi:
Julia (16-12-2011)
  #74  
Cũ 15-12-2011, 17:49
Dmitri Tran's Avatar
Dmitri Tran Dmitri Tran is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Dec 2010
Đến từ: Kisinhov-tp HCM
Bài viết: 1,335
Cảm ơn: 2,904
Được cảm ơn 2,884 lần trong 964 bài đăng
Default

Trích:
ninh viết Xem bài viết
Xin cảm ơn bác Dmitri Tran đã cất công lược dịch một bài viết khá dài của một tác giả hàng sao. Tuy nhiên, đọc xong tôi thấy không có ý gì mới hơn so với bài Математика выборов mà tôi giới thiệu ở post#50 tại trang 3 của topic này....
Biết đâu, mấy ông tướng xử lý bằng tay ở vùng thưa dân lại thiên vị cho NNTN, đồng thời ngại chia đến số lẻ nên cứ lấy 0.7, 0.75, 0.8, ... cho nó gọn!? Còn trong bài bác dịch thì cứ như là có sự chỉ đạo cấp TW cho việc đánh cắp phiếu bầu, nghe khủng khiếp quá.
Thôi, theo gương cụ Dị, em buông!
Cũng tác giả ấy nhưng bài kia phân tích bầu cử trước đây 2 năm. Nay "công nghệ" của các bác kiểm phiếu phát triển hơn, tác giả phát hiên thấy thêm cả phiếu bầu (như ở mục II. Tại các điểm với số người đi bầu đông có sự tăng đột biến số lượng phiếu bầu).
Còn có chỉ đạo từ TW hay không thì đó là "Vườn cấm", người đọc và muốn tìm hiểu tự rút ra kết luận!

@Nina:
Tôi chỉ dịch theo sở thích, việc dịch bài của Churov là của các bác ăn lương. Nếu thấy cần thì họ đã làm rồi.
Về ngôn ngữ trong Toán học. Hơn nửa năm làm việc ở UB KH và KT Nhà nước (tiền thân của Viện KH VN bây giờ) và hơn 10 năm dạy Giáo trình Lý thuyết XS cho SV năm thứ 3 khoa Toán ĐHSP, tôi và đồng nghiệp đều dùng như vậy. Còn nếu đem loại bài này thuyết trình cho các bác ở Tổ bầu cử dân phố thì chắc nên dùng từ "phân bố Gauss" theo ý chị?!
__________________
Bấm vào ảnh để xem kích cỡ đầy đủ.
Cả thế gian trong tay ta!
Весь мир в наших руках !
Trả lời kèm theo trích dẫn
  #75  
Cũ 15-12-2011, 19:34
SSX SSX is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Sep 2011
Bài viết: 1,451
Cảm ơn: 288
Được cảm ơn 1,332 lần trong 674 bài đăng
Default

Trích:
Dmitri Tran viết Xem bài viết
Các bác bàn luận chi tiết và hăng say quá (trong đó có các chổ “răng cưa” dị thường là 1 ẩn số khó hiểu) làm tôi cũng bị lây theo. Anh bạn vừa gửi cho tôi bài:
Nghiên cứu kết quả bầu cử Duma 2011 dựa trên Thống kê Toán học.
Tác giả: nhà Vật lý lý thuyết Sergey Spilkin.
Cũng là nhờ “máu” nghề nghiệp, tôi chịu khó trích dịch chi tiết và có giải thích thêm để mọi người cùng theo dõi.

I . Khái niệm chung. Ta hãy xem, tại sao số cư tri đi bầu, tỷ lệ % bầu cho ứng cử viên trong bất kỳ một cuộc bầu cử nào đều phân bố theo phân phối chuẩn hoặc gần chuẩn?
Để dễ hình dung về Luật số lớn trong Lý thuyết XS, ta xét VD tung đồng tiền. Ai cũng biết, XS để mặt có chữ số nằm trên là 50% (hay là 0,5), nhưng không có nghĩa là: cứ tung 100 lần chẳng hạn thì mặt chữ số nằm trên đúng 50 lần. Nhưng nếu ta làm thí nghiệm rất nhiều lần, 450 lần chẳng hạn, trong mỗi thí nghiệm ta tung đồng tiền 100 lần, và lập Biểu đồ phân bố kết quả số lần xuất hiện mặt chữ số (trục ngang OX) ứng với số lần làm thí nghiệm (trục đứng OY) thì nó có dạng sau:

Bấm vào ảnh để xem kích cỡ đầy đủ.

Vì số lần xuất hiện mặt chữ số là Đại lượng ngẫu nhiên nên biểu đồ không là đường cong trơn. Nếu ta lặp lại những thí nghiệm này vào 1 lúc khác thì con số chính xác có thể khác chút ít, nhưng dạng tổng quát của chúng có dạng như trên. Đường cong này là độ thị của Phân phối chuẩn (Gauss) có dạng hình Chuông, và nó đã được nghiên cứu rất nhiều và kỹ trong Lý thuyết XS. Trong tự nhiên, pph. chuẩn rất đặc trưng cho rất nhiều đại lượng khi chúng phụ thuộc vào nhiều yếu tố ngẫu nhiên, Việc tung đồng tiền là 1 VD.
Nếu ta xét trên phạm vi cả nước thì sự có mặt của cử tri tại điểm bầu cử, tỷ lệ % phiếu bầu cho ứng cử viên cũng là các đại lượng ngẫu nhiên, nếu mỗi người tự đi đến điểm bầu cử không bị ai lôi kéo và họ tự mình quyết định khi bỏ phiếu mà không bị tác động bên ngoài.


II. Tại các điểm với số người đi bầu đông có sự tăng đột biến số lượng phiếu bầu, không phù hợp quy luật tự nhiên,
Ta lập biểu đồ bầu cử. Vì số lượng các đại lượng ngẫu nhiên (tức là mỗi cử tri) quá lớn, đến hàng triệu, nên ta ra từng khoảng để dễ vẻ. Xem Biểu đồ bầu cử ở 1 số nước: Trục OX chỉ số người đi bầu với khoảng chia rộng 5%, trục OY – số lượng điểm bầu cử.
Bài này sai ngay ở đây, ở cách đặt vấn đề bác ạ. Đồng ý là mỗi lần tung đồng xu, là 1 tần suất xấp/ngửa. Khi số lần tung nhiều lên, nó tiến tới xác suất 0.5; Tương tự như thế là gieo con xúc sắc, với xác suất 1/6; Luật số lớn!

Tiếp theo đó, ông tác giả lập luận rằng, mỗi cử tri là một đại lượng và số lượng lớn ở các điểm bầu cử thì kết quả sẽ tiến tới cái gì đó, chẳng hạn X% và phải đồng đều, nếu không là gian!!!

Tuy nhiên, mỗi cử tri là một hàm mà cái nghiệm bỏ phiếu cho ai lại phụ thuộc vào vô số các biến số khác: công ăn việc làm, hy vọng-thất vọng, nam-phụ-lão-ấu, sư-sãi-vãi-tiểu... và yếu tố không thể bỏ qua là vùng miền. Biểu đồ như trên đã bỏ qua các yếu tố này.

Có nhận xét là, EP thắng lớn ở các vùng xa, giảm sút mạnh ở các vùng phát triển. Thí dụ Chechnya họ được 99.5%, Tuva 85.3%, Chukotka 70.3%, thấp nhất là 29% như ở Yaloslavl (cạnh Mát) và Mát 33%. Theo biểu đồ hình dưới, lấy từ RIA-NOVOSTI http://en.rian.ru/infographics/20111208/169491066.html

Như vậy EP có phân bố khá rộng trong dải từ 29-99.5%. Để phân tích tại sao như thế thì cần nhà xã hội học chứ không phải nhà toán học. Chẳng lẽ cả Chechnya hay Tuva... lại tập trung toàn phiếu gian?

Bầu cử TT Mỹ năm 2004, ông Bush đua nhiệm kỳ 2. Chiến sự sa lầy, chiến phí tăng vọt, ai cũng thấy ông Bush sẽ thất bại thảm hại trước ông Kerry. Thế rồi bỗng nhiên ông bạn vàng Bin Laden xuất hiện trên các kênh hot, giờ vàng tuyên đánh Mỹ tận cùng cây số. Không phải bạn bè chiến hữu, ai lại giúp nhau như thế? Chỉ còn ít ngày nữa là bỏ phiếu, đối thủ trở tay không kịp. Phiếu của ông Bush lên ầm ầm, đảo ngược ngoạn mục. Nếu lập biểu đồ nơi phát TV với nơi không phát hẳn có bước nhảy vĩ đại!!!

Bấm vào ảnh để xem kích cỡ đầy đủ.
Trả lời kèm theo trích dẫn
Có 4 thành viên gửi lời cảm ơn SSX cho bài viết trên:
hungmgmi (16-12-2011), Kóc Khơ Me (15-12-2011), Nina (15-12-2011), Old Tiger (16-12-2011)
  #76  
Cũ 15-12-2011, 20:51
hanoi hanoi is offline
Thịt nướng Nga - Шашлык
 
Tham gia: Nov 2009
Bài viết: 451
Cảm ơn: 54
Được cảm ơn 650 lần trong 276 bài đăng
Default

Bác Dmitri Nguyễn, cái luật mà ông tác giả nhắc đến có lẽ là định lý trung tâm (Central Limit Theorem). Định lý trung tâm cổ điển yêu cầu các biến phải độc lập, và được lấy mẫu từ cùng 1 phân bổ (identically independent i.i.d ) thì trung bình cộng của các biến này sẽ tiến tới phân bổ chuẩn (Normal distribution)

Như ý của SSX nói thì cử tri phụ thuộc vào nhau, và quyết định của cử tri là lấy ngẫu nhiên từ các phân bổ khác nhau vì vậy CLT cổ điển ko áp dụng được. Tuy vậy điều kiện Lyaponov ko đòi hỏi các cử tri phải lấy từ cùng một phân bổ mà chỉ yêu cầu các cử tri độc lập với nhau thì CLT vẫn được áp dụng. Kolmogorov thậm chí còn chứng minh rằng khi các biến phụ thuộc với nhau rất yếu (weak dependence) thì CLT vẫn áp dụng được.

Đó là về phương diện toán học, còn về phương diện xã hội học thì chẳng ai có thể đánh giá được độ phụ thuộc giữa các cử tri cho nên tôi nghĩ rằng các lý luận cho rằng dữ liệu phải tuân theo phân bổ chuẩn là chưa thuyết phục. Tôi chỉ nghi ngờ tính xác thực của dữ liệu vì nó có các hình răng cưa đều nhau mà thôi.
Trả lời kèm theo trích dẫn
  #77  
Cũ 15-12-2011, 22:55
nqbinhdi nqbinhdi is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Sep 2009
Đến từ: Hanoi
Bài viết: 1,469
Cảm ơn: 1,185
Được cảm ơn 4,002 lần trong 1,122 bài đăng
Default

Trích:
SSX viết Xem bài viết
Bài này sai ngay ở đây, ở cách đặt vấn đề bác ạ. Đồng ý là mỗi lần tung đồng xu, là 1 tần suất xấp/ngửa. Khi số lần tung nhiều lên, nó tiến tới xác suất 0.5; Tương tự như thế là gieo con xúc sắc, với xác suất 1/6; Luật số lớn!
[/IMG]
Mỗi một lần tung đồng xu (một phép thử ngẫu nhiên) ta được một kết cục (outcome) chứ không phải là tần suất, tập các kết cục có chung một tính chất là một kết quả (result). Số phép thử có cùng một kết cục trên tổng số các phép thử mới gọi là tần suất. Khi số phép thử tiến đến vô hạn thì tần suất tiến đến xác suất.

@ hanoi,

Cách tiếp cận tới định lý giới hạn trung tâm của nhiều nhà toán học khác nhau thì thể hiện hơi khác nhau, vì thế ta có các phát biểu của Lyapunov, Levy, Lindeberg...

Về việc các biến thành phần phải độc lập thống kê hay không thì cách nay chừng 5-6 năm tôi có yêu cầu một NCS của mình tiến hành mô phỏng máy tính để kiểm tra xem ISI gây bởi méo phi tuyến (nonlinear distortion) liệu vẫn có thể áp phân bố chuẩn cho nó không khi có mã chập (convolutional code), do với mã chập thì các bits liên quan với nhau, dẫn đến chuỗi các symbol tạo từ chuỗi bits như thế sẽ có quan hệ yếu với nhau. Khi không có mã chập thì cả Pupolin và Greenstein (IEEE Trans. on Com., 1987) - các GS Mỹ - lẫn tôi đều thấy rằng phân bố của ISI gây bởi méo phi tuyến đối với các tín hiệu M-QAM có thể xấp xỉ với các pdf chuẩn, chỉ khác là tôi còn thấy rằng dù có thể áp phân bố chuẩn song lại là phân bố chuẩn không tự nhiên mà với các meansvariances khác với các giá trị ấy xác định theo định nghĩa (1998). Kết quả mô phỏng máy tính của NCS của tôi cho thấy rằng dù các symbol có quan hệ với nhau song phân bố của ISI gây bởi méo phi tuyến trong hệ thống M-QAM (M-ary Quadrature Amplitude Modulation) vẫn có thể khớp (fit) rất tốt bằng các hàm pdf chuẩn, điều này củng cố cho nhận xét rằng quan hệ giữa các symbol khi có mã chập là khá yếu. Điều ấy cũng có nghĩa là điều kiện các biến ngẫu nhiên thành phần trong tổng phải độc lập thống kê là quá chặt.

Thay đổi nội dung bởi: nqbinhdi, 15-12-2011 thời gian gửi bài 23:12
Trả lời kèm theo trích dẫn
Được cảm ơn bởi:
hanoi (16-12-2011)
  #78  
Cũ 15-12-2011, 22:59
Dmitri Tran's Avatar
Dmitri Tran Dmitri Tran is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Dec 2010
Đến từ: Kisinhov-tp HCM
Bài viết: 1,335
Cảm ơn: 2,904
Được cảm ơn 2,884 lần trong 964 bài đăng
Default

Trích:
hanoi viết Xem bài viết
Bác Dmitri Nguyễn, cái luật mà ông tác giả nhắc đến có lẽ là định lý trung tâm (Central Limit Theorem). Định lý trung tâm cổ điển yêu cầu các biến phải độc lập, và được lấy mẫu từ cùng 1 phân bổ (identically independent i.i.d ) thì trung bình cộng của các biến này sẽ tiến tới phân bổ chuẩn (Normal distribution)
Hanoi à, trong khi trích dịch tôi bỏ qua những gì đi quá sâu về Tóan, mà dùng ngôn ngữ phổ thông hơn cho dễ hiểu, Định lý giới hạn trung tâm trong số đó. Vì khái niệm "hội tụ yếu" của dãy các biến ngẫu nhiên không phải ai cũng biết, chưa kể, nếu đưa nó ra thì phải nói về các biến ngẫu nhiên độc lập, và Kỳ vọng, Phương sai.... nữa. Nặng nề quá, trong khi ta cần phải biết cái cốt lõi của vấn đề.
(Tôi họ Trần nhé, không thấy ảnh chụp ở trần với các bác QKMN à?)
__________________
Bấm vào ảnh để xem kích cỡ đầy đủ.
Cả thế gian trong tay ta!
Весь мир в наших руках !
Trả lời kèm theo trích dẫn
Được cảm ơn bởi:
hanoi (16-12-2011)
  #79  
Cũ 15-12-2011, 23:28
SSX SSX is offline
Trứng cá hồi - Икра лососёвая
 
Tham gia: Sep 2011
Bài viết: 1,451
Cảm ơn: 288
Được cảm ơn 1,332 lần trong 674 bài đăng
Default

Trích:
nqbinhdi viết Xem bài viết
Mỗi một lần tung đồng xu (một phép thử ngẫu nhiên) ta được một kết cục (outcome) chứ không phải là tần suất, tập các kết cục có chung một tính chất là một kết quả (result). Số phép thử có cùng một kết cục trên tổng số các phép thử mới gọi là tần suất. Khi số phép thử tiến đến vô hạn thì tần suất tiến đến xác suất.
N phép tung đồng xu cho kết quả n1 xấp, N-n1 ngửa. Gọi n1/N là tần xuất hiện mặt ngửa. N đủ lớn thì tần xuất trùng với xác xuất. Em nói cho nó ngắn thôi.

Mặc dù số ghế Duma được chia theo % phiếu bầu cho các đảng nhưng việc phân chia các vị trí thì cần thỏa thuận. Có vẻ như việc này đã giải quyết nhưng chưa phải là quyết định cuối cùng.

Theo http://www.izvestia.ru/news/509788 sẽ có 7 vị phó Duma, ER nắm 4, còn 3 chia đều cho KPRF, LDPR và Fair Russia. Dĩ nhiên chủ tịch Duma sẽ là người của ER.

15 trong số 29 ủy ban của Duma sẽ so ER nắm, 14 còn lại chia cho các đảng có chân trong Duma.
Trả lời kèm theo trích dẫn
  #80  
Cũ 16-12-2011, 00:30
Nina Nina is offline
Kvas Nga - Квас
 
Tham gia: Nov 2007
Đến từ: TPHCM
Bài viết: 6,416
Cảm ơn: 5,003
Được cảm ơn 8,268 lần trong 3,723 bài đăng
Default

Trước hết, chúng ta nói đến sự phân bố Gauss được dẫn ra trong đông đảo các bài báo mà một số thành viên như Hanoi, Dmitri Tran, và một số thành viên khác trích dẫn. Sau đây, để tránh những hiểu nhầm không đáng có, trong bài viết này sẽ không sử dụng thuật ngữ “phân bố chuẩn”, mà sẽ dùng thuật ngữ phân bố Gauss.

Có lẽ cần nói ngay – phân bố Gauss chẳng liên quan gì đến sự phân bố phần trăm lượng phiếu bầu tại các điểm bầu cử. Để nhận được đường cong phân bố Gauss đẹp đẽ khi tung đồng xu, rõ ràng việc tung đồng xu này phải diễn ra trong những điều kiện tương đồng (các đồng xu sử dụng là giống nhau, chúng có sự phân bố vật chất đồng đều, không có chuyện trong đồng xu nhôm lại có một cục chì nặng hơn hẳn chẳng hạn). Còn nước Nga – đó là một quốc gia rộng lớn, với rất nhiều vùng khác nhau. Chúng ta cứ tưởng tượng – giả sử nước Nga chia làm 2 vùng, vùng A thì rất ủng hộ đảng Thích ăn thịt chó chẳng hạn, vùng B thì căm thù (xin không lạc đề sang Đảng Cộng sản Việt Nam và các vấn đề chính trị khác). Và giả sử cuộc bỏ phiếu diễn ra có sự tham gia của đảng Thích ăn thịt chó (TATC). Ở mỗi vùng chúng ta giả sử cũng sẽ có sự phân bố Gauss đối với đảng này. Thế thì kết quả tổng sẽ ra sao? Có thể nói ngay, trong đại đa số các trường hợp chúng ta sẽ được đường phân bố với 2 đỉnh khác nhau.

Cũng tương tự, giả sử 2 đảng nào đó tự dưng hợp nhất lại trước ngày bầu cử, và giả sử rằng cử tri vẫn bỏ phiếu cho họ. Vậy thì kết quả tổng của 2 phân bố Gauss liệu có còn là phân bố Gauss một đỉnh?

Và bây giờ, chúng ta xem xét nước Nga hiện tại với hàng chục vùng khác nhau, mỗi vùng có sự ưa thích và không ưa khác nhau đối với từng đảng. Vậy kết quả tổng sẽ là một “đường cong” nhiều đỉnh và có vẻ nát vụn. Do đó, đường cong có chân rộng và không đối xứng của chỉ thể hiện một điều – nước Nga hiện nay không có sự nhất trí cao độ với bất kỳ đảng phái nào.

-----
(còn tiếp).
Trả lời kèm theo trích dẫn
Có 5 thành viên gửi lời cảm ơn Nina cho bài viết trên:
Cá Măng (16-12-2011), hungmgmi (16-12-2011), Julia (16-12-2011), Kóc Khơ Me (16-12-2011), SSX (16-12-2011)
Trả lời

Bookmarks


Quyền sử dụng ở diễn đàn
Bạnkhông có quyền mở chủ đề mới.
Bạn không có quyền trả lời trong chủ đề này.
Bạn không có quyền gửi file đính kèm.
Bạn không có quyền sửa chữa bài viết.

BB code is Mở
Smilies đang Mở
[IMG] đang Mở
HTML đang Tắt

Chuyển đến


Giờ Hà Nội. Hiện tại là 00:44.


Powered by: vBulletin v3.8.5 & Copyright © 2026, Jelsoft Enterprises Ltd.
VBulletin ® is registered by www.nuocnga.net license.