Willkommen im Open-Data-Bereich von Stoppt die Rechten. Um eine tiefergehende wissenschaftliche, journalistische oder technische Auseinandersetzung mit unseren Inhalten zu fördern, stellen wir unser gesamtes Beitragsarchiv als strukturierte Rohdaten zur Verfügung.
Diese Datensätze sind maschinenlesbar, von überflüssigem HTML-Code bereinigt und optimal vorbereitet für Text-Mining, Netzwerkanalysen oder das Training und die Speisung von KI-Systemen (wie Custom GPTs, RAG-Pipelines oder lokal laufende LLMs).
Verfügbare Formate
Wir bieten die Daten in drei gängigen Standardformaten an:
JSON: Ideal für Web-Entwickler:innen, KI-Anwendungen und den direkten Import in NoSQL-Datenbanken.
CSV: Perfekt für die Datenanalyse mit Python (Pandas), R oder auch klassischer Tabellenkalkulation (Excel/Calc).
XML: Für klassische Archivsysteme und spezifische Content-Management-Importe.
⚠️ Wichtiger Hinweis zur Aktualität (Cut-Off-Datum)
Die Archive der vergangenen Jahre sind statisch und abgeschlossen. Für das laufende Kalenderjahr generiert unser System dynamische Datensätze. Achte hierbei auf das Cut-Off-Datum im Dateinamen (z.B. sdr-beitraege-2024-cutoff-16-04-2024.json). Dieses Datum markiert den Tag, an dem der Export generiert wurde. Der Datensatz enthält alle Beiträge bis zu diesem Stichtag.
Gesamtdownloads (Alle Jahre)
Lade hier das komplette Archiv als handliches ZIP-Paket herunter. Die Pakete enthalten die Datensätze aller Jahre in Einzeldateien unterteilt.
Die Struktur der Daten
Jeder Eintrag in unseren Datensätzen enthält folgende Informationen:
URL & Datum: Wo und wann der Artikel erschienen ist.
Titel & Plaintext-Inhalt: Der vollständige, bereinigte Text des Beitrags.
Kategorien & Hashtags: Die thematische Zuordnung (z.B. Polizei, Justiz, Rechtsextremismus).
Kontext-Label: Eine automatische Markierung (z.B. „Dokumentation: Einzelfall-Serie“), falls es sich um einen dokumentierten Vorfall handelt.
Lizenz und Quellennennung Die auf dieser Seite bereitgestellten Datensätze werden unter der Lizenz Creative Commons Namensnennung 4.0 International (CC BY 4.0) veröffentlicht.
Das bedeutet, Sie dürfen die Daten:
Teilen: Das Material in jedwedem Format oder Medium vervielfältigen und weiterverbreiten.
Bearbeiten: Das Material remixen, verändern und darauf aufbauen, und zwar für beliebige Zwecke, sogar kommerziell.
Unter folgenden Bedingungen:
Namensnennung: Sie müssen angemessene Urheber- und Rechteangaben machen (Quelle: Stoppt die Rechten / stopptdierechten.at), einen Link zur Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Wir laden die Tech- und Recherche-Community herzlich dazu ein, diese Daten für antifaschistische Forschungsarbeit und innovative Tool-Entwicklung zu nutzen.
Habt ihr bereits eine Idee? Baut ihr gerade ein Tool, oder habt ihr unseren Datensatz für eine Auswertung genutzt? Lasst es uns wissen! Wir würden herausragende Community-Projekte und Tools gerne in Zukunft hier auf der Seite vorstellen und verlinken.