Open Data: Das „Stoppt die Rechten” Daten-Archiv

Will­kom­men im Open-Data-Bereich von Stoppt die Rech­ten. Um eine tie­fer­ge­hen­de wis­sen­schaft­li­che, jour­na­lis­ti­sche oder tech­ni­sche Aus­ein­an­der­set­zung mit unse­ren Inhal­ten zu för­dern, stel­len wir unser gesam­tes Bei­trags­ar­chiv als struk­tu­rier­te Roh­da­ten zur Verfügung.

Die­se Daten­sät­ze sind maschi­nen­les­bar, von über­flüs­si­gem HTML-Code berei­nigt und opti­mal vor­be­rei­tet für Text-Mining, Netz­werk­ana­ly­sen oder das Trai­ning und die Spei­sung von KI-Sys­te­men (wie Cus­tom GPTs, RAG-Pipe­lines oder lokal lau­fen­de LLMs).

Verfügbare Formate

Wir bie­ten die Daten in drei gän­gi­gen Stan­dard­for­ma­ten an:

  • JSON: Ide­al für Web-Entwickler:innen, KI-Anwen­dun­gen und den direk­ten Import in NoSQL-Datenbanken.

  • CSV: Per­fekt für die Daten­ana­ly­se mit Python (Pan­das), R oder auch klas­si­scher Tabel­len­kal­ku­la­ti­on (Excel/Calc).

  • XML: Für klas­si­sche Archiv­sys­te­me und spe­zi­fi­sche Content-Management-Importe.

⚠️ Wichtiger Hinweis zur Aktualität (Cut-Off-Datum)

Die Archi­ve der ver­gan­ge­nen Jah­re sind sta­tisch und abge­schlos­sen. Für das lau­fen­de Kalen­der­jahr gene­riert unser Sys­tem dyna­mi­sche Daten­sät­ze. Ach­te hier­bei auf das Cut-Off-Datum im Datei­na­men (z.B. sdr-beitraege-2024-cutoff-16-04-2024.json). Die­ses Datum mar­kiert den Tag, an dem der Export gene­riert wur­de. Der Daten­satz ent­hält alle Bei­trä­ge bis zu die­sem Stichtag.

Gesamtdownloads (Alle Jahre)

Lade hier das kom­plet­te Archiv als hand­li­ches ZIP-Paket her­un­ter. Die Pake­te ent­hal­ten die Daten­sät­ze aller Jah­re in Ein­zel­da­tei­en unterteilt.

Die Struktur der Daten

Jeder Ein­trag in unse­ren Daten­sät­zen ent­hält fol­gen­de Informationen:

  • URL & Datum: Wo und wann der Arti­kel erschie­nen ist.

  • Titel & Plain­text-Inhalt: Der voll­stän­di­ge, berei­nig­te Text des Beitrags.

  • Kate­go­rien & Hash­tags: Die the­ma­ti­sche Zuord­nung (z.B. Poli­zei, Jus­tiz, Rechtsextremismus).

  • Kon­text-Label: Eine auto­ma­ti­sche Mar­kie­rung (z.B. „Doku­men­ta­ti­on: Ein­zel­fall-Serie“), falls es sich um einen doku­men­tier­ten Vor­fall handelt.

Lizenz und Quel­len­nen­nung Die auf die­ser Sei­te bereit­ge­stell­ten Daten­sät­ze wer­den unter der Lizenz Crea­ti­ve Com­mons Namens­nen­nung 4.0 Inter­na­tio­nal (CC BY 4.0) veröffentlicht.

Das bedeu­tet, Sie dür­fen die Daten:

  • Tei­len: Das Mate­ri­al in jed­we­dem For­mat oder Medi­um ver­viel­fäl­ti­gen und weiterverbreiten.

  • Bear­bei­ten: Das Mate­ri­al remi­xen, ver­än­dern und dar­auf auf­bau­en, und zwar für belie­bi­ge Zwe­cke, sogar kommerziell.

Unter fol­gen­den Bedingungen:

  • Namens­nen­nung: Sie müs­sen ange­mes­se­ne Urhe­ber- und Rech­te­an­ga­ben machen (Quel­le: Stoppt die Rech­ten / stopptdierechten.at), einen Link zur Lizenz bei­fü­gen und ange­ben, ob Ände­run­gen vor­ge­nom­men wurden.

Wir laden die Tech- und Recher­che-Com­mu­ni­ty herz­lich dazu ein, die­se Daten für anti­fa­schis­ti­sche For­schungs­ar­beit und inno­va­ti­ve Tool-Ent­wick­lung zu nutzen.

Habt ihr bereits eine Idee? Baut ihr gera­de ein Tool, oder habt ihr unse­ren Daten­satz für eine Aus­wer­tung genutzt? Lasst es uns wis­sen! Wir wür­den her­aus­ra­gen­de Com­mu­ni­ty-Pro­jek­te und Tools ger­ne in Zukunft hier auf der Sei­te vor­stel­len und verlinken.