http://gizmodo.com/5632105/the-real-stuff-white-people-like
QuoteWe selected 526,000 OkCupid users at random and divided them into groups by their (self-stated) race. We then took all these people's profile essays (280 million words in total!) and isolated the words and phrases that made each racial group's essays statistically distinct from the others'.
For instance, it turns out that all kinds of people list sushi as one of their favorite foods. But Asians are the only group who also list sashimi; it's a racial outlier. Similarly, as we shall see, black people are 20 times more likely than everyone else to mention soul food, whereas no foods are distinct for white people, unless you count diet coke.
Quote from: Mötkylä on 08.09.2010, 19:41:18
http://gizmodo.com/5632105/the-real-stuff-white-people-like
Mielenkiintoista dataa tosiaan. Viimeiset käppyrät oli kyllä tehty siinä toivossa, että kukaan ei huomaa missä juju piilee. "Race & Profile sophistication" ja "Religion & Writing profiency level" olivat käytännössä samat käppyrät. Latinot ja mustat menestyivät ensimmäisessä käppyrässä huonosti, ja mustat olivat väitetysti tekstien perusteella "50-kertaa enemmän kristittyjä" kuin muut. Latinoilla lienee jonkin verran samaa hommaa. Samoin ensimmäisestä käppyrästä huomataan, että "whites" menestyy varsin keskinkertaisesti, mikä taas ei ole kovin suuri ihme kun otetaan huomioon se, että "whites" on aika iso ryhmä keskinkertaisuuksia, ja "asian, m.eastern, indian" on puolestaan varsin polarisoitunut ryhmä välkyimpiä maahanmuuttajia. Amerikkaan (toisin kuin Suomeen) tulee varsin paljon huipputason opiskelijoita ja työntekijöitä ison rahan toivossa. Maassa on myös jonkinlaista kontrollia siihen, että millä edellytyksin sinne päästään (pl. latinot, jotka tulevat salaa).
Valistunut lukija ymmärtää myös "asian, m.eastern, indian" -kolmikon yhteyden ryhmiin "muslim, hindu, agnostic, buddhist, atheist". "jewish" puolestaan sijoituksellaan ei yllätä ketään. Tässäkin tapauksessa "syy" lienee geeneissä, ei uskonnossa. Näenkin kaksi viimeistä käppyrää lähinnä hätäkakkana, joka on päässyt spontaanisti sen jälkeen, kun on tehty tuo "Race & Profile sophistication" -käppyrä, joka ei ole ihan kaikkein poliittisesti korrekteinta dataa.
Quote"Race & Profile sophistication" ja "Religion & Writing profiency level" olivat käytännössä samat käppyrät.
...ja jos tuo olisi tehty niin, että koko pylväs näkyy, erot näyttäisivät paljon pienemmiltä. Nyt yksi pylväs on noin kaksi kertaa toisen kokoinen, vaikka ero on n. kasin ja ysin ero.