News:

Mikäli foorumi ei jostain syystä vastaa, paras paikka löytää ajantasaista tietoa on Facebookin Hommasivu,
https://www.facebook.com/Hommaforum/
Sivun lukeminen on mahdollista myös ilman FB-tiliä.

Main Menu

Anti-some-banni-kieli-projekti, eli ASBKP

Started by Henry, 05.02.2019, 06:38:05

Previous topic - Next topic

Henry

Anti-some-banni-kieli-projektin tarkoituksena on kehittää parviälyä hyödyntäen sellainen sanasto ja kielenkäytön tapa, joka ehkäisee punaviherkuplan ulkopuolisia alternative-keskustelijoita vihapuhesyytösten kohteeksi joutumiselta ja siitä väistämättä seuraavalta SOMEBANNILTA, jonka kohteeksi monet Facebookin ja Twitterin käyttäjät ovat joutuneet.

Oikeusministeriö on aloittanut uuden vihapuheen vastaisen kampanjan, jossa määritellään laveasti vihapuheen sisältö.
QuoteMitä vihapuhe on?

Euroopan neuvoston ministerikomitean määritelmän mukaan vihapuhetta ovat kaikki ilmaisumuodot, jotka levittävät, lietsovat, edistävät tai oikeuttavat etnistä vihaa, ulkomaalaisvastaisuutta, antisemitismiä tai muuta vihaa, joka pohjaa suvaitsemattomuuteen. Vihapuhe voi olla rikoslain mukainen rikos, yhdenvertaisuuslaissa tai tasa-arvolaissa kiellettyä syrjintää tai muuten yleisesti haitallista ilmaisua.

Rangaistava vihapuhe kohdistuu yhden ihmisen tai ihmisryhmän ominaisuuteen. Rikoslaissa rangaistuksen koventamisperusteina on mainittu rikoksen tekeminen rotuun, ihonväriin, syntyperään, kansalliseen tai etniseen alkuperään, uskontoon tai vakaumukseen, seksuaaliseen suuntautumiseen ja vammaisuuteen perustuvasta vaikuttimesta. Jos vihapuhe kohdistuu yhteen ihmiseen, kyseessä voi olla esimerkiksi kunnianloukkaus tai laiton uhkaus. Jos vihapuhe kohdistuu ihmisryhmään, kyseessä voi olla kiihottaminen kansanryhmää vastaan.
SOMEssa on vaarallista käyttää sanastoa, joka sisältää rotuun, ihonväriin, syntyperään, kansalliseen tai etniseen alkuperään, uskontoon tai vakaumukseen, seksuaaliseen suuntautumiseen tai vammaisuuteen liittyvää terminologiaa. Jos tuollainen terminologia yhdistetään negatiiviseen tai vihaiseen puheenparteen, seurauksena on lähes väistämätön SOMEBANNI.

Seuraavassa muutamia ideoita ASBKP:n edistämiseksi.

ÄLÄ KÄYTÄ SOMEALGORITMIEN HELPOSTI TUNNISTAMAA VIHATERMINOLOGIAA

Älä puhu s***leista, m********jista tai m****laisista. Keksi tilalle vaihtoehtoinen termi. josta sisältö käy selville, mutta joka ei sisällä vihapuhetta.

    "Isohameinen nainen varasti broilerin K-marketista."

Isohameisuus ei pidä sisällään rotua tai etnistä alkuperää, joten sanana sitä on suhteellisen turvallista käyttää.

Älä puhu ra****sista tai ah****telusta. Käytä jotain positiivisempaa termia ilman subjektia.

    "Teinitytöt rikastuivat ostarilla".

Rikastumisesta puhuminen tuo puheeseen positiivisen perussävyn, jota ei voi syyttää vihaisuudesta.

KÄYTÄ POSITIIVISTA, IRONISTA LÄHESTYMISTAPAA

Vihapuhesyyte ja SOMEBANNI ovat lähellä, jos käytät vihaista puheensävyä. Vihaisuuden ja negatiivisuuden sijaan on parempi kääntää uutiset päälaelleen ironiseksi positiivisuudeksi.

Ylläolevassa kuvassa (liite) tuomitaan  perinteinen maskuliinisuus ja ylistetään uutta liberaalia maskuliinisuutta, vaikka tarkkasilmäisempi katsoja saattaa huomata kuvan ironisen sävyn. Kuva ei kuitenkaan syyllisty vihapuheeseen.

JÄTÄ VIHAPUHE KATSOJAN SILMÄÄN

Laita triggeröivä kuva tai uutinen vain esille, ilman vihaista tai negatiivista esipuhetta. Usemmiten riittää vain punaviherkuplalaisen postauksen retwiittaaminen. Lukijasi saattavat vihastua, mutta sinua ei voi syyttää vihapuheesta tai SOMEBANNATA.

migri

Hyvä ajatus.

Minä tosin olen sen verran vanha ja jääräpää että minä en sanastoani ja kielenkäyttöäni rupea muuttamaan näiden kuspäiden takia.

Jos sen takia FB minut blokkaa niin aivan sama. Pitäköön tunkkinsa.

Kasvotusten tuleekin sitten heillä kestämistä sitäkin enemmän, esim. vaalikojuilla. Siitä sitten vaan soittelemaan polpoa paikalle.

I haven't seen democrats this mad since Republicans freed their slaves.
"Just because you're offended, doesn't mean you're right" - Ricky Gervais

kylähullu

Tällä tavalla olen toiminut jo pitkään.

Tämän tavan olen huomannut ärsyttävän enemmän "vastapuolta" verrattuna normaaliin "vihapuheeseen".

Skeptikko

#3
Quote from: Henry on 05.02.2019, 06:38:05
Älä puhu s***leista, m********jista tai m****laisista. Keksi tilalle vaihtoehtoinen termi. josta sisältö käy selville, mutta joka ei sisällä vihapuhetta.

Miten olisi korvata negatiiviset ilmaisut positiivisilla? Esimerkiksi sen sijaan, että sanoo: "sensuroitu poltti naisen hengiltä" voikin sanoa "Yhteisössään arvostettu herrasmies poltti naisen hengiltä. Tuskin kukaan olisi voinut aavistaa."

Quote
Laita triggeröivä kuva tai uutinen vain esille, ilman vihaista tai negatiivista esipuhetta.

Kuvasta tai epäillyn nimestä selviää usein myös etninen tausta tai uskonto ilman erikseen sen mainitsemista. Lannattaa myös poimia esiin ikäviä yksityiskohtia rikoksesta ja antaa ihmisten itse niiden pohjalta muodostaa käsityksensä.
En homona toivota tervetulleiksi Suomeen henkilöitä, jotka haluavat tappaa minut:
http://www.bbc.com/news/magazine-33565055

Tanskan pakolaisapu: hallitsematon tulijatulva johtamassa armageddoniin ja yhteiskuntamme tuhoon:
http://jyllands-posten.dk/international/europa/ECE7963933/Sammenbrud-truer-flygtningesystem/

Lalli IsoTalo

Quote from: Skeptikko on 05.02.2019, 09:58:41
Miten olisi korvata negatiiviset ilmaisut positiivisilla? Esimerkiksi sen sijaan, että sanoo: "sensuroitu poltti naisen hengiltä" voikin sanoa "Yhteisössään arvostettu herrasmies poltti naisen hengiltä. Tuskin kukaan olisi voinut aavistaa."

Toinen muunnelma:

"Perhe ja ystävät ovat ihan ihmeissään uskonyhteisössään arvostetun hyväntekijän amok-mokuilusta, joka sisälsi useita pään irtileikkaustapauksia ja muutamia iskuja viidakkoveitsellä. Kukaan ei voinut nähnyt tämän tulevan."

Quote from: https://fi.wiktionary.org/wiki/amok-juoksuAmok-juoksu
Mielipuolinen riehuminen aseen kanssa, hallitsematon murhanhimo
— Monikulttuuri = Kulttuurien sota
— Pakkomamutus = Kansanmurha
— Valtionvelka = Lapsen velkaorjuus
— Ei omaisuutta = Systeemin orja
— Digital ID = Systeemin orja
— Vihreä siirtymä = Kallis luontotuho
— Hiilineutraalius = VHM:n kuristus
— DEI, woke, SDP = Tasa-arvon tuho
— Valkoinen =  Rotusyyllinen
— Missä N, siellä R

Faidros.

Kun yksi ihminen kärsii harhasta, sitä sanotaan hulluudeksi. Kun monta ihmistä kärsii harhasta, sitä sanotaan uskonnoksi. -Robert M Pirsig-
Millainen luonne 2000-luvun mekaanikolla pitäisi olla,jotta hän sietäisi koneiden päälle kasattuja elektronisen hevonpaskan kerrostumia.
-Matthew B.Crawford-

dothefake

"Oma kansa ensin" -ajattelu on vahingollista.
-Tytti Tuppurainen

Mr.Reese

Lisääntymisen kokemusasiantuntija. Kansantuotteen kohottaja. Miniatyyrilaivateknikko.
"Heille kun sanoo disko disko, niin he ovat silleen, että mennään." - Tiia Nohynek

"Yleensä vauvat ja mummot on parhaita mielenosoittajia, koska luovat kuin itsestään turvallista tilaa." - Marjaana Toiviainen

JJAsi

Entä jos kääntää omat muumitus tekstinsä arabiaksi kun ei tuo poliisi arabiankieltä valvo. Ehkä sitten alkais botit valvomaan sitäkin  :flowerhat:

Penan kaveri Eki



Nyt tuli Henryltä hyvä idea. Ollaan ns. ytimessä... Mitä tässä tarvitaan on vihapuheelle oma korsoraattori.

Githubista löytyy omorfi -kirjasto, joka osaa analysoida suomenkielistä tekstiä sekä muodostaa sanojen kantamuotoja.

    https://github.com/flammie/omorfi

Jo omorfille syötetään esimerkiksi "Tekstin puhdistajalla voi siistiä vihapuhetta.", niin parsii se sen seuraavasti:


Tekstin
    teksi (subst)

puhdistajalla
    puhdistaa (verbi)
    puhdistaja (subst)

voi
    voi (subst)
    voida (verbi)

siistiä
    siistiä (verbi)

vihapuhetta
    vihapuhe (subst)


Tämän jälkeen korvataan poliittisesti epäkorrektit sanat ko. tarkoitukseen luodusta synonyymikannasta.

   puhdistaja -> harjaaja
   siistiä -> tyylitellä
   vihapuhe -> kivapuhe

Synonyymit taivutetaan alkuperäisen lauseen muotoihin ja generoidaan vihapuheesta vapaa ja poliittisesti korrekti vaihtoehtoinen lause:

    "Tekstin harjaajalla voi tyylitellä kivapuhetta."

Hieman vaikeammaksi taitaa tosin mennä, jos yksittäinen sana halutaan korvata kokonaisella lauseella, niin että taivutuskin muuttuu automaagisesti.

    puhdistaja -> hygieniaa rakastava persoona

Pitää hieman tutkia...

Synonyymikannalle pitää varmaan tehdä joku ylläpitotyökalu.

Jos löytyy Hommalta riittävästi koodaajia, niin tuollainenhan on kyhätty kasaan viikossa parissa.
"They were some bad people... I say hombres."

Tabula Rasa

#10
kaikki ilmaisumuodot, jotka levittävät, lietsovat, edistävät tai oikeuttavat etnistä vihaa, ulkomaalaisvastaisuutta, antisemitismiä tai muuta vihaa, joka pohjaa suvaitsemattomuuteen. Vihapuhe voi olla rikoslain mukainen rikos, yhdenvertaisuuslaissa tai tasa-arvolaissa kiellettyä syrjintää tai muuten yleisesti haitallista ilmaisua.

Eli käytännössä muotoilu niin väljä että minkä tahansa voidaan tulkita olevan vihapuhetta, ja tuomioitahan tämän mielivaltaisen pykälän perusteella on jo jaettukin. Lähinnä voidaan välttää somebanni koneoppivien algoritmien mukaan tuottamana käyttämällä aina uusia ja tietokoneen tuntemattomia sanoja, ja hylätä sanat joista botti antaa bannia. Ihmissensuroijan kanssa pitäisi keskustelijan olla yhtä älykäs tai älykkäämpi kuin sensori, eikä koskaan lipsua noiden kanssa. Ilmiasun pitäisi olla neuvostoliitosta tuttua positiivia, jossa kehutaan niin överiksi että neukuissa piti miettiä, annetaanko neuvostosankarin mitali, vai matka siperiaan, vai molemmat. Siellä virallista järjestelmää vastustavat loivat varsin nerokasta satiiria, ironiaa, sarkasmia ja muita sanataiteen muotoja jotka voi sinällään omaksua nykyeuvostoliiton tai minkä hyvänsä totalitäärisen ajatuksenvapautta ja sitä myötä poliittista oppositiota vastaan valheilla hyökkäävää totalitäriään pyrkivää järjestelmää vastaan.
Hedelmistään puu tunnetaan.

''UPMn Kyselytutkimuksessa 40 prosenttia ei sisäistänyt sitäkään että puu on vessapaperin ja pahvin raaka-aine.''

Saturnalia

#11
Neuvostoliitosta puheen ollen, ennenhän käytettiin termiä kremlologia.

QuoteTermi kremlologia syntyi Neuvostoliiton aikana, ja siitä on esimerkiksi Saksassa käytössä versio Kreml-astrologie, jolla viitataan tulkinnan epävarmuuteen
Wikipedia

Tässähän on pohjimmiltaan kyseessä lähes sama asia. Arvuutellaan vieraan valtion järjestelmän, tällä kertaa yritysten kylläkin jos se asiaa muuttaa, sananvapauden algoritmeja, sensuuria, botteja, kieltoja, tulkintoja.

Voisiko tätä kutsua vaikka Washingtonlogiaksi, Californialogiaksi, tai Faceologiaksi?
Eroa on tietysti siinä, että kremlologia pyrki ymmärtämään vieraan valtion kommunikaatiota, kun taas tässä pyritään ymmärtämään mitä vieraan valtion yritys antaa julkisesti sanoa. Yhdistävänä tekijänä epävarmuus tulkinnasta. Ai niillä oli jo Ylellä ihan mainos? Tää alkaa olla vähän kuin seurais tosiaankin erään romaanin näyttämöversiota tai tieteiselokuvaa. Lännen tulevaisuus lienee Kiina. Siis se valvontasysteemi, hyvänä puolena olisi kiinalaisten nuivuus. Jos jokin orwellmainen kontrollisysteemi pystytään teknisesti toteuttamaan, niin totta kai se toteutetaan ennemmin tai myöhemmin.

Tiskinlaimennus: tää ei siis ole vittuilua yhtään kellekään, kuin korkeintaan Facebookille. Tää tilanne alkaa vaan mennä jo suht absurdiksi. Päädymme ilmeisesti talousrommauksen kautta persaukiseen yhteiskuntaan, jossa ei ole sananvapautta. Yhteiskuntaan, jossa yksilö ei lunasta yhteiskuntakelpoisuuttaan käymällä töissä vaan olemalla hiljaa, kritiikitön.

Skeptikko

#12
Quote from: Penan kaveri Eki on 05.02.2019, 11:52:35
Githubista löytyy omorfi -kirjasto, joka osaa analysoida suomenkielistä tekstiä sekä muodostaa sanojen kantamuotoja.

Hyvä löytö. Tuolle voi tulla aivan oikeaakin käyttötarvetta näiden vihapuhejuttujen sijaan. Huvikseni kokeilin leikkiä vähän tuolla ja tein hyvin karkean ja yksinkertaistun Perl-skriptin, joka ei käytä suoraan mitään kirjastoja, vaan kutsuu tuon mukana tulevia apuohjelmia ja räplää sitten tekstimuotoisen syötteen kanssa:


#!/usr/bin/perl -w

use strict;
use IPC::Run3 qw(run3);

sub Censor {
    my $s = shift;
    my $result = "";

#    print "Censor($s)\n";
#    kissa [WORD_ID=kissa][UPOS=NOUN][NUM=SG][CASE=NOM]
    if ($s =~ /(\[WORD_ID=)([^]]+)(\].*)$/) {
my ($a, $word, $b) = ($1, $2, $3);

if ($word eq "kauhea") {
    $word = "kaunis";
} elsif ($word eq "valita") {
    $word = "nauttia";
} elsif ($word eq "somali") {
    $word = "ihminen";
}

$result = "$a$word$b";
    }

#    print "    Censored($result)\n";
    return $result;
}

sub Generate {
    my @lines = @_;
    my @result;
    my @censored_lines = map(Censor($_), @lines);
   
    my $stdin = join("\n", @censored_lines);
#    print "STDIN on:\n$stdin\n***********************\n";
   
    run3("omorfi-generate.sh", \$stdin, \my $stdout);

    foreach my $line (split /\n/, $stdout) {
last
    if ($line =~ /^Strings\s+Found\s+Missing\s+Results/);
# if ($line =~ /(\w+)\s/) {
if ($line =~ /\s(\S+)\s/) {    
    my $word = $1;
    push @result, $word;
#     print "($line) --> ($word)\n";
}
    }
   
    return join(" ", @result);
}

sub Filter {
    my $str = shift;
    my @result;

    my $skip = 0;
    foreach my $line (split /\n/, $str) {
if ($line =~ /^\s*$/) {
    $skip = 0;
} else {
    $line =~ s/^\w+\s+//;
    push @result, $line
if (!$skip);
    $skip = 1;
}
    }
   
    return @result;
}   

sub Convert {
    my $stdin = lc(shift);
#    run3("omorfi-analyse-text.sh -X", \$stdin, \my $stdout);
    run3("omorfi-analyse-text.sh", \$stdin, \my $stdout);
#    print "-" x 10, "\n$stdout\n", "-" x 10, "\n";
    return Generate(Filter($stdout));
}

sub ProcessText {
    my $str = shift;
    print "Alkuperäinen: $str\n";
    my $result = Convert($str);
    print "Sensuroitu: $result\n";
}

ProcessText("Feministit ovat kauheita ja valittavat kaikesta.");
ProcessText("Somali kävelee kadulla.");


Tuon ajaminen tuottaa (näköjään piste on kadonnut jonnekin, vaikka se aluksi onkin mukana, enkä jaksa tähän hätään tutkia tarkemmin):

QuoteAlkuperäinen: Feministit ovat kauheita ja valittavat kaikesta.
Sensuroitu: feministit ovat kauniita ja nautittavat kaikesta
Alkuperäinen: Somali kävelee kadulla.
Sensuroitu: ihminen kävelee kadulla

Tuotakin räpellystä tehdessä alkoi tulla joitain ongelmia vastaan, kuten:

Tuo kirjasto ei ainakaan oletusarvoisesti tunnu tunnistavan monia feministisen uuskielen sanoja, minkä takia niitä ei voi käyttää.

Sanoilla on hyvin tyypillisesti monia mahdollisia tulkintoja, mitä ihminen ei useimmiten huomaa, kun niin automaattisesti useimmiten osaamme enempiä miettimättä asiayhteydestä päätellen karsia väärät/hassut tulkinnat pois (esimerkiksi lauseissa "hän keksi ratkaisun" ja "keksi maistuu hyvältä" sana keksi tarkoittaa aivan eri asioita ja eri sanaluokkiakin). Tuo kirjasto listaa useita niistä mahdollisista tulkinnoista, mutta heitän kylmästi menemään muut kuin ensimmäisenä tulevan, kun lausetta takaisin generoidessa täytyy olla vain yksi tulkinta käytössä. Jos valittua tuleekin kyseisessä lauseessa väärä tulkinta, niin lopputuloskin voi olla hassua... Tuon kirjaston mukana tuli myös sellainen ohjelma, joka pyrkii karsimaan oudoimmat tulkinat pois, mutta pikaisesti testaamalla sen tuottama formaatti oli vähän erilaisessa muodossa kuin mitä tuo generoiva ohjelma haluaa sisäänsä, minkä takia en sitten tähän hätään jaksanut yrittää käyttää sitä. Tässä noiden parin esimerkkilauseen sanojen monitulkintaisuutta (tosin tässä tapauksessa epäilen tuon kirjaston myös hieman bugaavan, mutta se ei poista itse ongelmaa yleisellä tasolla - eli sitä, että sanat ovat hyvin usein monitulkintaisia):

Quote
feministit   [WORD_ID=feministi][UPOS=NOUN][NUM=PL][CASE=NOM]

ovat   [WORD_ID=olla][UPOS=AUX][VOICE=ACT][MOOD=INDV][TENSE=PRESENT][PERS=PL3]
ovat   [WORD_ID=olla_2][UPOS=VERB][VOICE=ACT][MOOD=INDV][TENSE=PRESENT][PERS=PL3]

kauheita   [WORD_ID=kauhea][UPOS=ADJ][CMP=POS][NUM=PL][CASE=PAR]

ja   [WORD_ID=ja][UPOS=CCONJ]

valittavat   [WORD_ID=valita][UPOS=VERB][VOICE=PSS][PCP=VA][CMP=POS][NUM=PL][CASE=NOM]
valittavat   [WORD_ID=valittaa][UPOS=VERB][VOICE=ACT][MOOD=INDV][TENSE=PRESENT][PERS=PL3]

kaikesta   [WORD_ID=kaikki][UPOS=PRON][SUBCAT=QUANTIFIER][NUM=SG][CASE=ELA]

ja

Quote
somali   [WORD_ID=somali][UPOS=NOUN][NUM=SG][CASE=NOM]

kävelee   [WORD_ID=kävellä][UPOS=VERB][VOICE=ACT][MOOD=INDV][TENSE=PRESENT][PERS=SG0]
kävelee   [WORD_ID=kävellä][UPOS=VERB][VOICE=ACT][MOOD=INDV][TENSE=PRESENT][PERS=SG3]

kadulla   [WORD_ID=katu][UPOS=NOUN][NUM=SG][CASE=ADE]

Tuo katsoo noissa kokeiluluonteisissa korvauksissa vain sitä sanan perusmuodon tekstiesitystä, muttei vaivaudu tarkistamaan edes, että onko kyseessä edes oikean sanaluokan sana. Sanaluokka olisi tosin helppo tarkistaa samalla, mutten viitsinyt tähän pikakokeiluun sitä laittaa - kuten en myöskään sitä, että kovakoodauksen sijaan näitä korvaussääntöjä tulisi jostain ohjelman ulkopuolelta.

Kuten poiskommentoiduista debug-tulostuksista yms voi huomata, kyseessä on vain testi - ja eräänlainen päänavaus idean testaamiseksi, eikä mitään vakavasti otettavaa. Oikea toteutus kannattaisi tehdä monellakin tapaa toisin, mutta tuolla oli helppo testata asiaa.
En homona toivota tervetulleiksi Suomeen henkilöitä, jotka haluavat tappaa minut:
http://www.bbc.com/news/magazine-33565055

Tanskan pakolaisapu: hallitsematon tulijatulva johtamassa armageddoniin ja yhteiskuntamme tuhoon:
http://jyllands-posten.dk/international/europa/ECE7963933/Sammenbrud-truer-flygtningesystem/

Peltipaita

Jos tänne haalitaan lisää somaleja, kuinka rahamme riittävät kaikkien meille tulleiden arabien hyvinvointiin?
"Kumiluodit ovat hyväksyttävyyden rajoilla"  sanoi Matti Vanhanen, kun Kataloniassa haluttiin saada mielipide selville äänestämällä.

Penan kaveri Eki

#14
Quote from: Skeptikko on 06.02.2019, 04:22:05
Sanoilla on hyvin tyypillisesti monia mahdollisia tulkintoja, mitä ihminen ei useimmiten huomaa, kun niin automaattisesti useimmiten osaamme enempiä miettimättä asiayhteydestä päätellen karsia väärät/hassut tulkinnat pois (esimerkiksi lauseissa "hän keksi ratkaisun" ja "keksi maistuu hyvältä" sana keksi tarkoittaa aivan eri asioita ja eri sanaluokkiakin). Tuo kirjasto ...

Tää on juuri se ongelma, miksi esim. Google Translate -palvelu kääntää englannista suomeksi vähän miten sattuu. Ainoa tapa saada käännös semanttisesti oikein (tai tässä tapauksessa saada vaihtoehtoiseen lauseeseen alkuperäistä lausetta vastaava merkitys), olisi käyttää jokin neuroverkkosovellus (hypetermein; AI-robotiikka-applikaatio). Sekin olisi aasia tyhmempi, mutta oppisi jos "palvelun" käyttäjät jaksaisi sitä opettaa.

    https://github.com/josephmisiti/awesome-machine-learning

Mutuna sanoisin että tarkoitukseen tehty synonyymikirjasto olisi toimivin vaihtoehto. Ainoastaan tässä kirjastossa olevat sanat korvattaisiin. Mallia ne***ri- > yön timo.

Vaikeampi olisi uudelleenkirjoittaa negatiivissävyinen teksti positiiviseksi. Ehkä jostain puppugeneraattorista saisi ideoita? Joku post-prosessori siis lisäisi käsiteltävään tekstiin sopivasti ylistäviä välilauseita ja -kommentteja.

    https://github.com/skvark/puppugeneraattori
    https://github.com/teropa/nlp


Edit: Jos suuri osa somen vihapuhealgoritmeja laukaisevat sanat saisi korvattua, niin olisi sekin jo jotain.
"They were some bad people... I say hombres."

mikkoellila

Quote from: Henry on 05.02.2019, 06:38:05
SOMEssa on vaarallista käyttää sanastoa, joka sisältää rotuun, ihonväriin, syntyperään, kansalliseen tai etniseen alkuperään, uskontoon tai vakaumukseen, seksuaaliseen suuntautumiseen tai vammaisuuteen liittyvää terminologiaa. Jos tuollainen terminologia yhdistetään negatiiviseen tai vihaiseen puheenparteen, seurauksena on lähes väistämätön SOMEBANNI.

Naamakirjassa algoritmi reagoi automaattisesti tiettyihin ylläpidon kielletyksi määrittelemiin sanoihin täysin riippumatta siitä, missä yhteydessä niitä on käytetty, ja onko puhetapa ollut mitenkään negatiivinen tai vihainen.
En halua Euroopan yhteiskuntien muuttuvan sellaisiksi kuin Afrikan ja Lähi-idän yhteiskunnat. En usko afrikkalaisten ja lähi-itämaalaisten käyttäytyvän Euroopassa eri tavalla kuin Afrikassa ja Lähi-idässä. Tästä syystä vastustan Afrikan ja Lähi-idän väestöjen siirtymistä Eurooppaan.

Tapio Äyräväinen

Jep.

Kuten ikiaikaiseen sloganiin:

"Ryssä on ryssä vaikka voissa paistaisi."

sanoo mies, jonka on sukujuuriltaan ryssä ja kärsi siksi bannia.

mikkoellila

Quote from: Tapio Äyräväinen on 07.02.2019, 14:55:29
Jep.

Kuten ikiaikaiseen sloganiin:

"Ryssä on ryssä vaikka voissa paistaisi."

sanoo mies, jonka on sukujuuriltaan ryssä ja kärsi siksi bannia.

Minä sain 30 vrk bannia vuosien takaisesta postauksestani, jossa sanoin, että en usko, että ryssä hyökkää Suomeen.

Sanoin siis, että en pidä Venäjää uhkana Suomelle, enkä usko, että Suomen ja Venäjän välille tulee sotaa minun elinaikanani.

Useimmat venäläiset varmaan pitäisivät tällaista positiivisena lausuntona ja vastakohtana Venäjä-hysterian lietsomiselle, mutta bannia tuli silti, koska algoritmi jakelee banneja automaattisesti sanasta ryssä täysin riippumatta postauksen asiasisällöstä.

Samasta sanasta voi tulla banneja vaikka kuinka monta kertaa. Jos joku on käyttänyt sanaa ryssä esim. kerran vuodessa viimeisen kymmenen vuoden aikana, eli vuosina 2008-2018, siitä voi tulla 10 kertaa 30 vrk banni vuoden 2019 aikana.

Algoritmi nääs googlettaa ihmisten postaushistoriaa taaksepäin ja voi jakaa banneja vaikka kuinka monista kielletyksi määriteltyjen sanojen käyttökerroista vaikka kuinka monen vuoden takaa.
En halua Euroopan yhteiskuntien muuttuvan sellaisiksi kuin Afrikan ja Lähi-idän yhteiskunnat. En usko afrikkalaisten ja lähi-itämaalaisten käyttäytyvän Euroopassa eri tavalla kuin Afrikassa ja Lähi-idässä. Tästä syystä vastustan Afrikan ja Lähi-idän väestöjen siirtymistä Eurooppaan.

Peltipaita

Ilmiannot ovat yksi merkittävä syy banneihin, joita ei voi sanataiteiluilla mitenkään estää. Halla-ahon bannit esimerkkinä.
"Kumiluodit ovat hyväksyttävyyden rajoilla"  sanoi Matti Vanhanen, kun Kataloniassa haluttiin saada mielipide selville äänestämällä.

mikkoellila

Quote from: Peltipaita on 07.02.2019, 16:04:41
Ilmiannot ovat yksi merkittävä syy banneihin, joita ei voi sanataiteiluilla mitenkään estää. Halla-ahon bannit esimerkkinä.

Halla-aho itse ei ole saanut banneja niistä postauksista, joiden jakamisesta toiset ihmiset ovat saaneet banneja.

Tämä osoittaa, että bannit eivät aina perustu mihinkään ilmiantoihin, koska jos Halla-ahon postauksista olisi tehty ilmiantoja, banneja olisi tullut sekä Halla-aholle että hänen postauksiaan jakaneille ihmisille.

Useimmat bannit perustuvat algoritmiin, eivätkä ilmiantoihin.

Ilmeisesti naamakirjassa on algoritmi, joka jakelee banneja Halla-ahon ym. persupoliitikkojen postausten jakamisesta, vaikka kyseiset poliitikot itse eivät olisi saaneet banneja.
En halua Euroopan yhteiskuntien muuttuvan sellaisiksi kuin Afrikan ja Lähi-idän yhteiskunnat. En usko afrikkalaisten ja lähi-itämaalaisten käyttäytyvän Euroopassa eri tavalla kuin Afrikassa ja Lähi-idässä. Tästä syystä vastustan Afrikan ja Lähi-idän väestöjen siirtymistä Eurooppaan.

Tapio Äyräväinen

Juuri näin.

Siksi kannattaa ovelasti käyttää kuvia. Niitä ei taida algoritmi tunnistaa...

Lalli IsoTalo

#21
Quote from: Tapio Äyräväinen on 07.02.2019, 20:32:09
Juuri näin.

Siksi kannattaa ovelasti käyttää kuvia. Niitä ei taida algoritmi tunnistaa...

Mikäli kuvassa on tekstiä, OCR eli tekstintunnistus (Optical character recognition) lukee kuvatiedoston tekstit ja muuttaa ne tekstiksi. Siksi tunnistautumispalveluiden tekstit ovat lähes lukukelvottomia ihmisilmällekin. Tämäkin kannattaa huomioida.

Stadin slangi ja murteet sekä kirjankielen välttäminen on yksi keino sotkea tekstiä koneen hämäämiseksi, samoin eri kielten sanojen käyttö suomalaisten sijaan, käyttäen suomen sijapäätteitä ja suomen ääntämyksen kirjoitusasua.

"Swidduago meikää aibo11aatte, ääshoulemat" = miksi minua tuijotatte, ryppyreiät?

Suomen kieli on rikas, rikastetaan sitä vähän lisää!  :D
— Monikulttuuri = Kulttuurien sota
— Pakkomamutus = Kansanmurha
— Valtionvelka = Lapsen velkaorjuus
— Ei omaisuutta = Systeemin orja
— Digital ID = Systeemin orja
— Vihreä siirtymä = Kallis luontotuho
— Hiilineutraalius = VHM:n kuristus
— DEI, woke, SDP = Tasa-arvon tuho
— Valkoinen =  Rotusyyllinen
— Missä N, siellä R

MW

Kuvantunnistus (kuten kasvojentunnistus) -tekniikatkin lienevät aika pitkällä, kysykää vaikka kiinalaisilta.

Murteella, slangilla ja kirjainmerkkien korvaamisella vaikka sopivalla ASCII-hässäkällä päässee vielä hetken, eksoottinen pieni kieliryhmä?

Sinänsä ei juuri kiinnosta, en ole faceen koskenut kepilläkään, koskaan, enkä ajatellut aloittaa nyt.

Lalli IsoTalo

Quote from: MW on 07.02.2019, 22:12:56
... eksoottinen pieni kieliryhmä?

Aletaan salaisten viestien eksoottiseksi koodinpuhujiksi, jonka koodi kehittyy koko ajan.

Quote from: https://en.wikipedia.org/wiki/Code_talkerA code talker was a person employed by the military during wartime to utilize a little-known language as a means of secret communication. The term is now usually associated with United States service members during the world wars who used their knowledge of Native American languages as a basis to transmit coded messages. In particular, there were approximately 400 to 500 Native Americans in the United States Marine Corps whose primary job was to transmit secret tactical messages. Code talkers transmitted messages over military telephone or radio communications nets using formally or informally developed codes built upon their native languages. The code talkers improved the speed of encryption and decryption of communications in front line operations during World War II.
— Monikulttuuri = Kulttuurien sota
— Pakkomamutus = Kansanmurha
— Valtionvelka = Lapsen velkaorjuus
— Ei omaisuutta = Systeemin orja
— Digital ID = Systeemin orja
— Vihreä siirtymä = Kallis luontotuho
— Hiilineutraalius = VHM:n kuristus
— DEI, woke, SDP = Tasa-arvon tuho
— Valkoinen =  Rotusyyllinen
— Missä N, siellä R

Sikanez

Voisihan noin aluksi kokeilla joidenkin nettihuijarien käyttämää kikkaa eli laitetaan sanan sekaan saman näköinen kirjanin toisesta aakkostosta ja katsotaan tunnistaako systeemi sanaa. Tässä on esimerkiksi kyrillinen Ka (os kopionti onnistui) käytettäksi sanassa neekeri:
K
"Ei ole olemassa syyttömiä ihmisiä. On vain huonosti kuulusteltuja." - Josef Stalin

Möhömaha

Perussanastohan löytyy täältä

Edesmennyt Rähmispossu oli sarkasmin mestari. Lanseerasi sanat:
Lapsukainen (= alle 40 -vuotias maahanmuuttajarikollinen)
Keppostelu (= kaikki terrori-iskua pienemmät rikokset)
Offer me money, offer me power, I don't care. I'll say what I want to say, and if the consequence is losing money, so be it -Elon Musk

mikkoellila

Quote from: Sikanez on 10.02.2019, 14:44:54
Voisihan noin aluksi kokeilla joidenkin nettihuijarien käyttämää kikkaa eli laitetaan sanan sekaan saman näköinen kirjanin toisesta aakkostosta ja katsotaan tunnistaako systeemi sanaa. Tässä on esimerkiksi kyrillinen Ka (os kopionti onnistui) käytettäksi sanassa neekeri:
K

Kuulemma joku sanoi fb:ssä bannin käytettyään sanaa neekeri muodossa n33k3ri, jonka siis algoritmi tunnisti/tulkitsi juurikin sanaksi neekeri. 
En halua Euroopan yhteiskuntien muuttuvan sellaisiksi kuin Afrikan ja Lähi-idän yhteiskunnat. En usko afrikkalaisten ja lähi-itämaalaisten käyttäytyvän Euroopassa eri tavalla kuin Afrikassa ja Lähi-idässä. Tästä syystä vastustan Afrikan ja Lähi-idän väestöjen siirtymistä Eurooppaan.

Vaniljaihminen

Fraaseja nyt ei yksinkertaisesti kannata käyttää, meemit ovat suositeltavampia mutta kyllä ne niistäkin sakottaa, joskin hitaammin.

Yhteiskuntakritiikin esittämisestä on malleja historiasta, esimerkiksi se että kritiikki laitetaan romaanissa vihollisen suuhun. Tai sitten pitää puhua vertauksilla kuin Jeesus.

Hyvä ohje tulee itse asiassa Mao Zedongilta: "vallankumouksellisen on uitava kuin kala vedessä".
"Meillä on niin ihana hallitus mutta miehet vihaa.."

acc

Quote from: Tabula Rasa on 05.02.2019, 12:17:09
kaikki ilmaisumuodot, jotka levittävät, lietsovat, edistävät tai oikeuttavat etnistä vihaa, ulkomaalaisvastaisuutta, antisemitismiä tai muuta vihaa, joka pohjaa suvaitsemattomuuteen. Vihapuhe voi olla rikoslain mukainen rikos, yhdenvertaisuuslaissa tai tasa-arvolaissa kiellettyä syrjintää tai muuten yleisesti haitallista ilmaisua.

Eli käytännössä muotoilu niin väljä että minkä tahansa voidaan tulkita olevan vihapuhetta,.....

Niinpä... kaikki tarkoittaa kaikkea. Jos kehuu liiallisesti monikulttuuria tai jotain rikastajaryhmää, se voidaan tulkita vihapuheeksi. Tulevaisuudessa poliisi joutuu arvioimaan, onko monikulttuurimyönteinen teksti, puhe tai muu ilmaisu sellainen, että se vaikuttaakin vastaanottajissaan käänteisellä tavalla. Ja jos vaikuttaa monikulttuurivastaisella tavalla, onko teko harkittu tai tehty täyttä ymmärrystä vailla.

Koska yksittäinen viranhaltija haluaa pitää työpaikkansa, hän voi varmuuden vuoksi tulkita minkä tahansa sanoman rangaistavaksi vihapuheeksi. Tämä erityisesti silloin, jos ilmiantoja on tullut paljon. Jos ilmiantojen käsittelijä ei löydä vihaa, hän vaarantaa oman asemansa, koska häntä voidaan epäillä vihapuheen suojelijaksi.

Vihapuhetta syntyy, koska todellisuus ja unelma eroavat toisistaan. Unelman kannattajat tulkitsevat todellisuutta kuvaavat viestit vihapuheeksi ja kiihotukseksi. Koska vihapuhetta on unelmoitsijoiden mielestä jo nyt olemassa, sitä on heidän mielestään todennäköisesti myös vuonna 2039. Silloin ongelmana on, että vihapuhe on muuttunut peitellyksi ja sellaiseksi, että sitä olisi vuonna 2019 pidetty kivapuheena. Silloin tuomitaan kaikesta. Varmuuden vuoksi. Tuomitse muita ennen kuin muut tuomitsevat sinut.


Quote
https://www.poliisi.fi/vihapuhe
Euroopan neuvoston ministerikomitean suosituksessa (R 97 20) vihapuhe on määritelty seuraavasti:" Vihapuhetta ovat kaikki ilmaisumuodot, jotka levittävät, lietsovat, edistävät tai oikeuttavat etnistä vihaa, ulkomaalaisvastaisuutta, antisemitismiä tai muuta vihaa, joka pohjaa suvaitsemattomuuteen.
2017 Personality 13: Existentialism via Solzhenitsyn and the Gulag
(Huomaa: käsittämätön feministin raivokohtaus, kohta 42:00 eteenpäin)
https://www.youtube.com/watch?v=w84uRYq0Uc8