Skip to content
This repository has been archived by the owner on Aug 5, 2024. It is now read-only.
/ coronakorpus Public archive

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus / Building a corpus in German dedicated to coronavirus

License

Notifications You must be signed in to change notification settings

adbar/coronakorpus

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus

Diese Linksammlung fokussiert auf deutschsprachige Webseiten zur COVID-19-Pandemie (u.a. mit erkenntnistheoretischer, gesellschaftlicher, politischer und wirtschaftlicher Perspektive) und zum Virus (u.a. aus medizinischer Sicht).

Die folgenden Kriterien werden beachtet, um ein Gleichgewicht zwischen den Quellen zu erzeugen, damit das Korpus vielfältig/vielschichtig und grob nach Quelle/Land und bestmöglich nach Genre ausgewogen werden kann.

  • Tages- und Wochenzeitungen (z.B. Der Freitag), Magazine und Online-Magazine (z.B. Manager-Magazin) sowie Nachrichtenquellen (z.B. Deutschlandfunk) werden zu erstrangigen Quellen, dabei muss ein Gleichgewicht im Sinne der Artikelanzahl zwischen einigen Großen/Bekannten bestehen.
  • Einige zusätzliche Quellen kommen dazu, weil sie von besonderem Interesse sind (keine Balance erwünscht: Ärzte Zeitung und Ärzteblatt), und (im einem kleineren Ausmaß) das politische Spektrum besser abdecken, z.B. Tichys Einblick oder Jungle World.
  • Weitere Online-Quellen, insbesondere Blogs, sollen zusätzliche qualitative Einblicke geben, z.B. literarische Tagebücher oder Podcasts mit Christian Drosten.

Auf Basis des zusammengetragenen Materials wird eine Sammlung von Webdokumenten erstellt, die im Anschluss der Öffentlichkeit zugänglich gemacht wird:

Es ist uns wichtig, das Korpus so umfangreich und belastbar wie möglich zu gestalten. Deshalb ermutigen wir alle Nutzer*innen ausdrücklich dazu, uns Hinweise zu weiteren Textressourcen zuzusenden.

Letzter Stand: ca. 78000 Links, November 2020.

N.B.: Nachfolger dieses Korpus ist ein Monitorkorpus aus Hunderten von Webquellen, der Webmonitor.

Kontext

Zentrum für digitale Lexikographie der deutschen Sprache (ZDL), Berlin-Brandenburgische Akademie der Wissenschaften.

Kontakt: Adrien Barbaresi.

Lizenz

CC BY-SA 4.0

About

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus / Building a corpus in German dedicated to coronavirus

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published