Dictionary analysis
Dictionary analysis#
As second method the dictionary analysis is used to identify and count comments from lateral thinkers. The dictionary analysis is a very simple method and is derived from sentiment analysis. Due to the simplicity of the model, the results must be critically examined and questioned at the end. For example, due to the bag-of-words representation in the model, we cannot take negations into account, which can lead to misleading results [Atteveldt, 2022].
The dictionary used is the RPX-Lex dictionary, which was developed to measure German right-wing populist conspiracy discourse [Puschmann et al., 2022]. The dictionary contains 14,105 terms which are divided into 13 categories, such as Suspicion, Antisemitism or Esotericism [Puschmann et al., 2022]. It should be noted, that some terms appear in more than one category, as they are assigned to several categories. This circumstance will be taken into account later in the analysis so that hits are not counted twice.
First, we load the dictionary and as we can see, it contains 14,105 terms as stated in the paper.
from IPython.core.display_functions import display
import pandas as pd
from cleantext import clean
from tqdm import tqdm
rpx_dict = pd.read_csv("dictionary_analysis/rpc_lex.csv", delimiter=";")
display(rpx_dict[["term", 'category_en']])
term | category_en | |
---|---|---|
0 | -etage | Scandalization |
1 | #abgase | Scandalization |
2 | #kreuzfahrtschiffe | Scandalization |
3 | #schwerölverbrennung | Scandalization |
4 | #umweltskandal | Scandalization |
... | ... | ... |
14100 | wurzelrassenlehre | Esotericism |
14101 | z-plan | Esotericism |
14102 | zahlenmystik | Esotericism |
14103 | zeitenwende | Esotericism |
14104 | zentralwillen | Esotericism |
14105 rows × 2 columns
Then we define the method for the dictionary analysis. The comment is passed to the method and first it is split into a list of words. After that it iterates over each term in the dictionary. First it checks if the term already occurs in the identified terms and if so the iteration is skipped. This check is necessary to skip terms that are part of several categories and therefore already identified. Since the dictionary contains not only single words, but also phrases with several words, we need to take these into account. If the dictionary term is a phrase, it is checked whether the phrase occurs in the text or not, and if the dictionary term is a single word, it is checked whether the word occurs in the list of words created at the beginning.
def get_dictionary_analysis_term_occurrence(text: str):
term_occurrence = 0
identified_terms = []
text_tokens = set(text.split(" "))
for term in rpx_dict.term.to_list():
if term in identified_terms:
continue # Skip terms that have already been identified but occur in multiple categories
if " " in term:
if term in text: # Dictionary term consists of several words
term_occurrence+=1
identified_terms.append(term)
else:
if term in text_tokens: # Dictionary term is a single word
term_occurrence+=1
identified_terms.append(term)
return term_occurrence, identified_terms
Before the dictionary analysis can be performed, a bit of preprocessing is required. As before, we load the comments and make sure they are all in string format. Then a function is defined which removes emojis, links and mentions. This method is then applied to all comments. In the end all empty comments are removed, which are basically all comments that only contain emojis.
comments_df = pd.read_csv("data/youtube_comments_500.csv")
comments_df["Comments"] = comments_df["Comments"].astype(str)
def clean_text(text:str):
text = clean(text, no_emoji=True, lang="de")
new_text = []
for token in text.split(" "):
if not token.startswith('@') and not token.startswith('http'):
new_text.append(token)
return " ".join(new_text)
comments_df["Comments"] = comments_df["Comments"].apply(lambda text: clean_text(text))
comments_df = comments_df[comments_df.Comments != ""]
Iterating over all comments to apply the dictionary analysis takes several minutes. In the end, two columns are added to the dataframe. One contains the number of dictionary terms found and the other a list of the terms found. We can see that 345,620 comments contain at least one term from the dictionary, which corresponds to 85% of all comments.
dict_term_occurrence_list = []
dict_identified_terms_list = []
for text in tqdm(comments_df.Comments.to_list()):
occurrence_counter, identified_terms_list = get_dictionary_analysis_term_occurrence(text)
dict_term_occurrence_list.append(occurrence_counter)
dict_identified_terms_list.append(identified_terms_list)
comments_df["dict_term_occurrence"] = dict_term_occurrence_list
comments_df["dict_identified_terms_list"] = dict_identified_terms_list
comments_df.to_csv("data/dictionary_analysis.csv", index=False)
display(comments_df.loc[comments_df['dict_term_occurrence'] > 0])
Unnamed: 0 | Comments | dict_term_occurrence | dict_identified_terms_list | |
---|---|---|---|---|
0 | 0 | wollt ihr jetzt jeden tag einen großen bericht... | 7 | [ganz, großen, bericht, schön, panzer, sinnlos... |
1 | 1 | wenn scholz alles besser weiss, wieso braucht ... | 3 | [braucht, wieso, besser] |
2 | 2 | die grünen hatten früher das peace zeichen als... | 9 | [grünen, heute, militär, panzer, wächst, frühe... |
3 | 3 | der westen ist ein kriegstreiber bis es zu ein... | 6 | [kommt, lange, idioten, kriegstreiber, westen,... |
4 | 4 | frieden schaffen ohne waffen. | 2 | [schaffen, frieden] |
... | ... | ... | ... | ... |
406236 | 406236 | was die union wieder will, die leute sind doch... | 10 | [land, leute, sollen, sowieso, wäre, brauchen,... |
406237 | 406237 | kann jeder deutscher werden ,kein problem sola... | 9 | [gehen, deutsche, überwacht, irgendwelche, arb... |
406238 | 406238 | dann nimm die leute bei dir auf und verpflege ... | 1 | [leute] |
406239 | 406239 | als staatenloser hatt mans aber auch nicht lei... | 1 | [stimmt] |
406240 | 406240 | wann kommt der blackout? kinder könnt ihr ja e... | 4 | [kinder, kommt, wann, könnt] |
345620 rows × 4 columns
If we look at a histogram of the distribution of the number of hits, we can see that many comments contain only a few words from the dictionary.
hist = comments_df.plot.hist(column="dict_term_occurrence", legend=False, bins=50, range=[0,50])
hist.set_xlabel("Number of dictionary hits")
hist.set_ylabel("Number of comments")
hist.set_title("Distribution of the number of hits")
hist.legend(["Dictionary term occurrence"])
<matplotlib.legend.Legend at 0x176949ee0>

Since many comments contain only a few terms from the dictionary, it might be interesting to see how the comment style changes if one only select comments that contain several terms from the dictionary. The number of comments containing more than four terms from the dictionary is already much smaller. Four or more terms contain only 133,700 comments, which corresponds to 33% of all comments.
display(comments_df.loc[comments_df['dict_term_occurrence'] > 4])
Unnamed: 0 | Comments | dict_term_occurrence | dict_identified_terms_list | |
---|---|---|---|---|
0 | 0 | wollt ihr jetzt jeden tag einen großen bericht... | 7 | [ganz, großen, bericht, schön, panzer, sinnlos... |
2 | 2 | die grünen hatten früher das peace zeichen als... | 9 | [grünen, heute, militär, panzer, wächst, frühe... |
3 | 3 | der westen ist ein kriegstreiber bis es zu ein... | 6 | [kommt, lange, idioten, kriegstreiber, westen,... |
7 | 7 | donnor, beweis deine behauptung, die ukraine w... | 5 | [deutschland, beweis, ukraine, wagenknecht, so... |
10 | 10 | der fraktionslose bundestagsabgeordnete robert... | 12 | [eigenen, geht, politische, traut, dabei, klar... |
... | ... | ... | ... | ... |
406222 | 406222 | und außerdem kann sich jeder im krankenhaus be... | 5 | [kohle, lassen, völlig, sachen, außer] |
406223 | 406223 | du hast es nicht verstanden junge ..\ndie ampe... | 7 | [deutschland, junge, hast, leben, arbeiten, eu... |
406233 | 406233 | deutschland hat fertig!\nausbildung fehlanzeig... | 5 | [deutschland, gerne, unsere, bestimmt, rentner] |
406236 | 406236 | was die union wieder will, die leute sind doch... | 10 | [land, leute, sollen, sowieso, wäre, brauchen,... |
406237 | 406237 | kann jeder deutscher werden ,kein problem sola... | 9 | [gehen, deutsche, überwacht, irgendwelche, arb... |
133700 rows × 4 columns
In order to check the analysis, random examples from the comments are selected and classified below. If a sample is taken from all comments that contain at least one term from the dictionary, the following comments can be assigned to the lateral thinking movement:
Sample 392575
Sample 99556
Sample 128489
(Sample 318015)
Smaple 64994
(Sample 4130)
for index, values in comments_df.loc[comments_df['dict_term_occurrence'] > 0].sample(10)[
["Comments", "dict_identified_terms_list"]].iterrows():
print(f"Sample {index + 1}: {values['dict_identified_terms_list']}\n")
print(values["Comments"])
print("-" * 150)
Sample 392575: ['deutschland', 'frauen', 'zieht', 'geburtenrate']
"taliban verbannen frauen von universitäten" - deutschland 2050 dank invasion, geburtenrate und des vernichtungshasses der ökobolschewisten. zieht euch warm an, mädels.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 99556: ['bereicherern', 'bilder', 'zeigt', 'lieber', 'staatsfunk', 'zeigen', 'ausländischen']
hat der staatsfunk keine bilder von den bereicherern zeigen wollen? ihr zeigt lieber bilder von ausländischen faschisten.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 128489: ['blödsinn', 'einfach', 'mitbekommen', 'rest', 'warum', 'arzt', 'politiker']
ich habe auch schon während der "maskenpflicht" keine maske getragen. ich habe mir einfach ein attest vom arzt geholt und fertig. ich habe mich nur gewundert, warum der rest bei diesem blödsinn mit den masken mitmacht. zumal doch alle mitbekommen haben, dass es bei den masken nur darum ging, dass als politiker getarnte pharmalobbyisten an den maskendeals verdienen.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 318015: ['öffentlichen', 'bitte']
bitte reform des öffentlichen rundfunks.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 305435: ['warum']
und warum haben sie den kosovo blockiert?
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 316087: ['berichtet', 'regierungen', 'warum', 'proteste']
warum berichtet ihr nicht über die massiven proteste gegen die regierungen in peru und brasilien?
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 64994: ['bekämpft', 'einfach', 'wissen', 'wie', 'wahren', 'chinesen']
einfach mal die wahren infektionszahlen zensiert.
die chinesen wissen wie viren bekämpft werden.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 4130: ['stellen', 'militär', 'besser', 'sollten', 'usa']
ich finde, wir sollten unser militär besser unter das kommando der usa stellen !
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 189388: ['bedeutet']
bedeutet das, es sind 15, 5, oder -10 grad in der ukraine?
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 233506: ['macht', 'mächtige', 'politik', 'viele', 'wie', 'anarchie', 'selten']
für wie viele sekunden? anarchie ist selten stabil und viele mächtige können ihre macht auch ohne politik nutzen.
------------------------------------------------------------------------------------------------------------------------------------------------------
To check the quality of the dictionary analysis, we also look at how many hits can be confirmed if at least 4 or 10 words from the dictionary appear in the comment. With at least 4 comments, the following samples can be assigned to the lateral thinking movement:
Sample 320027
Sample 380858
Sample 289717
Sample 363650
for index, values in comments_df.loc[comments_df['dict_term_occurrence'] > 4].sample(10)[["Comments", "dict_identified_terms_list"]].iterrows():
print(f"Sample {index+1}: {values['dict_identified_terms_list']}\n")
print(values["Comments"])
print("-"*150)
Sample 320027: ['arbeit', 'dafür', 'artikel', 'merkt', 'sklaven', 'sklaverei', 'spielen', 'niemals', 'reichen', 'gesellschaft', 'solange', 'naja', 'normaler']
chancengleichheit sind leere versprechen. mit normaler arbeit wird man niemals reich. ihr sklaven dürft die supersportwagen jachten luxus artikel und villas für die reichen bauen. und kriegt dafür hungerlohn. ist das gerechtigkeit?
oder moderne sklaverei mit vorzügen. naja wenn kümmert es, spielen ja alle brav mit. solange es klassen gesellschaft gibt. aber nichts ist für ewig. merkt euch meine wörter.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 380858: ['seit', 'sollen', 'wegen', 'irgendeine', 'teppich', 'themen', 'kurze', 'chinesen', 'gestern']
themen der sendung:
00:00 - hi ihr ottos
00:21 - mccarthy seit gestern nicht beliebter geworden
03:33 - chinesen sollen bei einreise auf vertrauenswürdigkeit getestet werden
05:49 - sylvestergewalt nur ausdruck von integrationswunsch
08:38 - ehrenparade und roter teppich für lambrecht wegen puma-erfolg
10:54 - frankreich hat funktionierende panzer
11:20 - ex-papst immer noch tot
11:47 - irgendeine britin jetzt auch tot
12:17 - kurze unterbrechung
13:50 - die ottozahlen
14:10 - wetter: herbst
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 10895: ['finde', 'jahr', 'wurde', 'dabei', 'grünen', 'ziele', 'gesehen', 'fdp', 'stärken']
ich finde es gut das die spd, fdp und die grünen ihr ziele stärken verfolgen/durchsetzten wollen. was dabei rauskommt haben wir letztes jahr gesehen als nur noch diskutiert wurde und man sich auf nix einigen konnte.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 289717: ['dafür', 'geht', 'polizei', 'traurig', 'unsere', 'angeblichen', 'mann', 'wer', 'wo', 'müssen', 'staat', 'um die', 'sinnlose', 'unseren', 'verschwenden', 'bundestag', 'steuergelder', 'bezahlen', 'garnicht', 'gleich', 'bitten', 'deutscher', 'klima']
die angeblichen klima schützer das ich nicht lache machen nur ärger wo sie können und verschwenden unsere steuergelder für sinnlose polizei einsätze die sie dann von den objekten gereummt werden und wer zahlt das alles wir von unseren steuergelder geht garnicht alle die meinen sich ögenwo an zu ketten und die polizei zu behindern sollte mann gleich zu kasse bitten um die gelder der einsätze der polizei wieder zubekommen damit nicht wir alle steuerbürger dafür bezahlen müssen sonder nur die solche einsätze auslösen es ist traurig von den staat das die klima aktiviesten nicht zu kasse gebeten werden können die solche einsätze verursacht tübisch deutscher bundestag keiner will sich die händeverbrennen
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 317230: ['deutschland', 'ansichten', 'gibt', 'idioten', 'unserer', 'warum', 'verstehe', 'linken', 'konsens', 'politiker', 'afd']
ich verstehe die linken & afd nicht ihre politiker haben bis auf kleinigkeiten die selben ansichten warum gibt es hier keinen konsens gegen die idioten unserer regierung..
grün ist in deutschland ja schon ein synonym für blödheit.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 363650: ['hass', 'mehrheit', 'überwältigende', 'wegen', 'grund', 'wahre', 'von wegen', 'eu', 'usa', 'hetze', 'vorgehen']
von wegen hass und hetze bei twitter....die überwältigende mehrheit will die begnadigung von snowden und assange! oder ist das der wahre grund dafür, dass die usa hörige eu gegen twitter/musk vorgehen will.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 182816: ['kommen', 'macht', 'beginn', 'heute', 'laut', 'russischen', 'russland', 'bekannten', 'handeln', 'putin', 'daher', 'doktor', 'professor', 'westen', 'aktiv']
die vorhersagen der weltberühmten bulgarischen hellseherin baba vanga werden heute in putin-russland von putin-propagandamachern sehr aktiv genutzt. baba vanga hat wiederholt erklärt, dass ab dem beginn des 21. jahrhunderts wladimir in russland an die macht kommen wird, der den westen besiegen und russland wird zum spirituellen zentrum der welt. daher ist es möglich, dass putin sich in seinem handeln unter anderem von den vorhersagen von baba vanga leiten lässt, denn laut dem bekannten russischen oppositionsblogger, politikanalytiker, professor und doktor der geschichtswissenschaften valeri solowej, ist wladimir putin dem spiritualismus sehr zugetan.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 118531: ['deutschland', 'ermordet', 'heucheln', 'irgendetwas', 'fehlt', 'mädchen']
wenn es den gesinnungsbraunen sektendepp:innen an erinnerungsvermögen fehlt und es ihnen "unglaublich" und "unvorstellbar" vorkommt, dass 14-jährige mädchen in deutschland ermordet werden; wenn sie beileid heucheln und irgendetwas fordern:
gesinnungsbraune sektendepp:innen haben beispielsweise diese 14-jährigen mädchen ermordet: ayse, 1996 in mölln; miya, 1996 in lübeck; jana, 1998 in saalfeld/saale; armela, 2016 on münchen, sabine, 2016 in münchen.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 222739: ['feindlich', 'interesse', 'wissen', 'wer', 'deutliches', 'eventuell', 'russland', 'daran', 'regieren', 'usa', 'china', 'gegenüber']
solemnis
zu wissen wer in den usa regiert, ist für alle relevant.
egal ob man den usa freundlich, oder feindlich gegenüber steht.
dies hat nichts mit winseln zu tun.
auch in russland und china hat man ein deutliches interesse daran zu wissen, wer regiert, oder eventuell regieren könnte.
lg
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 31931: ['kinder', 'macht', 'sagen', 'schieben', 'namen', 'bestimmt', 'cdu', 'guten', 'wähler', 'schule']
der typ , der meinem 1/2 namen geklaut hat , ist eine rampensau , der sich immer in den vordergrund schieben muß . bestimmt hat er schon in der schule andere kinder verpetzt , um sich bei den leheren beliebt zu machen .
übrigens : ich bin zwar kein wähler der cdu , aber ich muß sagen , dass unser ministerpräsident daniel günther einen guten job macht .
grüße aus dem hohen norden .
------------------------------------------------------------------------------------------------------------------------------------------------------
With at least 10 comments, the following samples can be assigned to the lateral thinking movement:
Smaple 88531
Sample 158036
Sample 308754
Sample 124415
Sample 341145
Sample 205747
for index, values in comments_df.loc[comments_df['dict_term_occurrence'] > 10].sample(10)[["Comments", "dict_identified_terms_list"]].iterrows():
print(f"Sample {index+1}: {values['dict_identified_terms_list']}\n")
print(values["Comments"])
print("-"*150)
Sample 88531: ['deutschland', 'eigenen', 'falsche', 'geht', 'sowas', 'brauchen', 'wie', 'welt', 'gelöst', 'genug', 'probleme', 'verdienst', 'china']
cruhser
oh, falsche antwort, 1. mein verdienst ist überdurchschnittlich und geht dich ein scheißdreck an. und 2. ist mir die baerbock sowas von scheißegal, die fährt durch die welt und verhält sich wie ein holzklotz und will auch noch china ans bein pischern. die ist behindert man. und es geht darum das wir im eigenen land, in deutschland genug probleme haben, die erstmal gelöst werden müssen. und sollche steuergeldverteilerrin brauchen wir schon mal garnicht.
du intelligenzbestie.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 158036: ['deutschland', 'eins', 'kommen', 'kotzt', 'zwei', 'beitrag', 'schwer', 'tage', 'tote', 'reichsbürger', 'messer', 'asylbewerber', 'mädchen']
es war wieder klar, dass zwei tage nachdem ein asylbewerber ein mädchen mit einem messer schwer verletzt- und eins zu tote gemetzelt hat, jetzt ein beitrag zu reichsbürgern kommen musste. dieser heuchler-staat kotzt mich so an. die reichsbürger sind in deutschland das kleinste problem.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 308754: ['ganze', 'jahr', 'jahren', 'leute', 'seit', 'verlogene', 'zurück', 'hört', 'schön', 'sieht', 'geschickt', 'gespielt', 'gute', 'karten']
magyarorszagon richtig. und schön verlogen. das ganze jahr hört und sieht man mache leute nicht aber weihnachten melden die sich dann. ich habe karten zurück geschickt und anrufe ignoriert. alle kontakte abgebrochen. nun habe ich seit einigen jahren niemanden mehr weil ich das verlogene getunte nicht mit gespielt habe. ihnen eine gute zeit.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 124415: ['deutschen', 'land', 'traurig', 'überhaupt', 'geworden', 'läuft', 'nachrichten', 'vertuschen', 'ganzen', 'dreck', 'ausland', 'deutsches']
läuft in den deutschen nachrichten überhaupt noch was deutsches oder wird immer nur übers ausland berichtet? damit man den ganzen dreck hier vertuschen kann oder so traurig was aus diesem land hier geworden ist.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 107110: ['bekommt', 'klar', 'leugnet', 'merkel', 'video', 'wissen', 'davon', 'gibt', 'partei', 'wahrheit', 'neue', 'stehen', 'einzige', 'flüchtlingskrise', 'folgen', 'misere', 'afd', 'migrationspolitik']
bei julian reichelt gibt es ein gutes video zur misere "die wahrheit über die neue flüchtlingskrise // faeser leugnet migrations-probleme!": von der ampel-regierung wird viel versprochen, es folgen aber keine taten. und die kommunen stehen kurz vorm kollaps. davon will die zuständige innenministerin faeser (spd) aber nichts wissen - aus angst, die afd bekommt mehr stimmen.
wie gesagt: die afd ist die einzige partei im bundestag, die schon unter merkel klar gegen die migrationspolitik gewesen ist.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 341145: ['ganz', 'kommt', 'instrumentalisieren', 'medienwirksam', 'mittlerweile', 'politisch', 'polizisten', 'bitte', 'darin', 'verbreitet', 'müsste']
nachdem alle "böllermänner" wieder auf freiem fuß sind, müsste nun, nach muster, der offene opferbrief eines verletzten polizisten o.a. medienwirksam verbreitet werden. darin appelliert man beruhigend an die bürger, das silvesterchaos bitte nicht politisch zu instrumentalisieren um gegen "rächts" vorzugehen..............oder war's andersrum? man kommt ja mittlerweile ganz durcheinander!
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 166147: ['darf', 'gerecht', 'leute', 'volk', 'wohl', 'denke', 'deutsche', 'gibt', 'namen', 'wenig', 'wer', 'wiederum', 'bleibt', 'ganzen', 'wunschdenken', 'besser', 'arbeiten', 'halten', 'wahrscheinlich', 'gewählt', 'spd', 'verlangt']
ja dann informier dich mal wer jetzt verteidigungsminister werden könnte
es gibt jetzt schon 3 namen
aber die können die qualifikationen die du hier verlangst und die ich hier und auch ich denke mal auch das gesamte deutsche volk hier verlangt nicht gerecht werden
3 namen die wiederum nichts bringen
1. lars klingbeil spd vorsitzender
2. eva högl spd mitglied
3. siemtje möller
schade kein general a.d. dabei
also im groben und ganzen könntest ein klein wenig besser werden aber das war's dann aber auch
es sei denn die ausgewählten leute wenn sie dann als verteidigungsminister gewählt werden arbeiten für das verteidigungsministerium und für dieses deutsche volk
was sehr wahrscheinlich nur ein wunschdenken ist
träumen darf man ja wohl noch oder ?
weil träume halten einen am leben
aber ich denke mal das bleibt alles ihr eim traum
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 205747: ['wegen', 'fall', 'mann', 'wer', 'auf jeden fall', 'gesehen', 'irgendwelche', 'hauptsache', 'holen', 'stand', 'asylanten']
auf jeden fall sonst machen die nur scheiße, dann holen die irgendwelche asylanten und die machen das, hauptsache billig, hat mann gesehen bei corona, wer stand supermärkte und so weiter an der tür und hat geschaut wegen masken, ausländer!
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 230148: ['geht', 'herr', 'schande', 'sofort', 'verleugnet', 'herrn', 'wahre', 'wahren', 'welt', 'gott', 'wort', 'werdet', 'jesus']
tut sofort wahre buße erniedrigt euch in schande all eurer sünden vor dem herrn jesus christus. nimmt gottes gnade an. verleugnet euer sündiges leben. werdet knechte gottes. evangelisiert 24 stunden. liest gottes wort die bibel und liebt nicht diese welt noch was in der welt ist. ihr dürft nix mehr wollen. vertraut nur herrn jesus christus. geht zu den ungläubigen hin und bekehrt sie zum einzig wahren gott herr jesus christus.
------------------------------------------------------------------------------------------------------------------------------------------------------
Sample 210313: ['gebiete', 'kohle', 'rest', 'deutlich', 'einwohner', 'verschweigen', 'wie', 'wo', 'recht', 'genug', 'rein', 'bestimmt', 'entscheidungsträger']
rwe ist rein kommerziell orientiert, die entscheidungsträger bei rwe würden sich bestimmt nicht den aufwand machen und einwohner entschädigen, gebäude abreißen und gebiete absperren, wenn wo anders noch genug leicht zugängliche kohle ist. studien, die behaupten, dass das bisherige abbaugebiet ausreiche, verschweigen oft, dass der aufwand (und damit auch die co2 produktion) für den rest des bisherigen abbaugebietes deutlich höher ist, wie für die relativ leicht zugängliche kohle unter dem recht kleinem ort lützerath.
------------------------------------------------------------------------------------------------------------------------------------------------------