Seminar:
Digitalisierung, Künstliche Intelligenz und Demokratie

Dr. Paul C. Bauer
mail@paulcbauer.de
@p_c_bauer
www.paulcbauer.de
License for original material Licence

Updated: Jul 18, 2024

1 Einführung

Übersicht

  • Link: https://bookdown.org/paulcbauer/digitalisierung/
  • Es gibt keine dummen Fragen! (Montonie, geteilte Fragen usw.)
  • Wer studiert Politkwissenschaft…
    • …im Hauptfach? ..Polyvalent? ..etwas anderes? Welches Semester? Erstes Seminar mit Hausarbeit? Teilnahme sicher?
  • Inhalt des Seminars & Syllabus
    • Datacamp
  • Künstliche Intelligenz im Studium (Transparenz, Expertentum, Digital Demenz, Abhängigkeit)
  • Verteilung der Referate

2 Digitalisierung & Big Data & KI & Demokratie

  • Terminfindung: https://forms.gle/vgLK7m6F7c2ASBfL7

Digital revolution

  • Q: Ever heard of the digitalization/digital revolution/information age?
  • = Third Industrial Revolution
  • “historical period that began in the mid-20th century to the early 21st century. It is characterized by a rapid shift from traditional industries, as established during the Industrial Revolution, to an economy centered on information technology” (Wikipedia)
  • Most information is stored in digital form today…
    • …although I still have some paper folders at home!
  • “The World’s Technological Capacity to Store, Communicate, and Compute Information” (Hilbert and López 2011)1

Global Information Storage Capacity

Source: https://en.wikipedia.org/wiki/Big_data

The Internet: Physical structure

  • “global system of interconnected computer networks that uses the Internet protocol suite (TCP/IP) to communicate between networks and devices. It is a network of networks that consists of private, public, academic, business, and government networks of local to global scope, linked by a broad array of electronic, wireless, and optical networking technologies. The Internet carries a vast range of information resources and services, such as the inter-linked hypertext documents and applications of the World Wide Web (WWW), electronic mail, telephony, and file sharing.” (Wikipedia)
  • There is a physical structure behind it!
  • We have come a long way: The Sound of dial-up Internet
  • Q: How many people in Germany/India/China/U.S. used internet in last three months (2020)?

The Internet: Access (1)

The Internet: Access (2)

Insights
  • Strong inequality across countries/continents (2020)
    • Don’t forget inequality within populations!
  • Path-dependency: Certain countries may skip evolutionary steps
  • Research occurs within a historical context of technology adoption (e.g., social media, dating apps)
  • Findings may not generalize from one geographic context to another (e.g., adoption rates)
  • Stunning how quickly we adapt to technology, e.g., smartphone and forget the past
  • Different generations socialized into different technology

Adoption of different technologies

  • Q: When did different technologies affect societies? (U.S. data)

Platform usage (1): Social Media Adoption

  • Q: Why is it hard to estimate social media platform users?

Platform usage (2): Social Media Adoption (Barchart)

  • Q: Anything surprising for you in this graph?

Platform usage (3): Social Media Adoption (Barchart)

Insights
  • Platforms may come and go… (e.g., Myspace, Vine)
  • Platform companies (e.g., Google, Facebook, etc.) invest in AI
  • Usage depends very much on age/cohort!

Big data & new data (1)

  • Big Data Characteristics: The three V’s (see Graph on next slide)
    • High volume: As a result of the increasing number of data-collection instruments
    • High velocity: New information is being added at high rates
    • Great variety: Various sources create a heterogeneous set of data points
  • Ten characteristics (Salganik 2017): Big; Always-on; Non-reactive; Incomplete; Inaccessible; Nonrepresentative; Drifting; Algorithmically confounded; Dirty; Sensitive
  • Designed data vs. Found data

Big data & new data (2)

  • Bad graph but highlights the idea! Source: https://en.wikipedia.org/wiki/Big_data

Big data & new data (3) (Entwisle and Elias 2013)

Big data & new data (4)

Exercise: What data can reveal about you…

  • Look at the picture below (Bern!). What does it show? What can we learn/measure with such data?
Insights
  • Geo-locations + time stamps of individuals among most powerful data
  • Data may have non-obvious use cases (Mayer-Schönberger and Cukier 2012, 82, 86) (e.g. traffic prediction)
  • Inventors/data collectors themselves might not foresee the positive or negative potential of their data
  • Visualization strongly affects what you see (with/without lines)
  • Indirect data & identification
  • Database better memory than myself!

Whatsapp (and others)

  • What data are they collecting about you?
  • End-to-end encryption since ~2016 (used system by Open Whisper Systems → Signal)
  • Informationen die wir erheben
    • Some more background from Wired
  • …better use Signal?

Systematische Fragen

  • Was für Daten werden gesammelt? (z.B. Bewegungsdaten, Social media posts, Surfverhalten)
  • Welche Akteure speichern die Daten und wo werden die Daten gespeichert? (z.B. Google + Google Cloud; Regierung Bawü)
  • Für welche Ziele wollen diese Akteure die Daten nutzen?
  • Wie sehen die Akteure selbst aus? (z.B. wer entscheidet bei Google?)

SML in the social sciences (1)

  • Supervised machine learning (SML): Focuses on prediction problems
    • Goal: Predict \(Y_{i}\) using \(X_{i}\)
    • Approach
      • Estimate a model on a data subset (training data)
      • This model has not seen test data outputs \(\color{#984ea3}{Y_{i}}\) before!
      • Test this model’s predictive accuracy in another subset (test data);
      • If accurate enough, use this model to predict missing data (e.g., ? in Table 1)
Insights
  • Q: Assume we want to predict life satisfaction. What are the features in the table above?

  • Q: Where does the training data come from? Do we always have the outputs/outcome readily available?

  • Q: What is training data you are using? Or missing data you want to predict?

  • Missing data could be future observations, but also observations that are missing in a dataset we already collected, i.e., missing data imputation simply predicts missing datapoints in a dataset

Table 1: Dataset/sample
\(\text{Unit i} \quad\) \(Name \quad\) \(X1_{i}^{Age} \quad\) \(X2_{i}^{Educ.} \quad\) \(D_{i}^{Unempl.} \quad\) \(Y_{i}^{Lifesat.} \quad\)
1 Sofia 29 1 1 3
2 Sara 30 2 1 2
3 José 28 0 0 5
4 Yiwei 27 2 1 ?
5 Julia 25 0 0 6
6 Hans 23 0 1 ?
.. .. .. .. .. ..
1000 Hugo 23 1 0 8

SML in the social sciences (2)

  • Methods & models: Linear/logistic regression, Penalized regression, classification and regression trees, nearest neighbor, neural networks/deep learning

  • Social science examples: Recidivism (Dressel & Farid 2018), deadly conflict (Cederman & Weidmann 2017), divorce (Heyman et al. 2001), mental health (Chancellor & De Choudhury 2020), poverty/wealth (Blumenstock 2015), unemployment (Sundsøy et al. 2017), sentiment (Martínez-Cámara et al. 2014, Bauer & Clemm 2021), vote shares/elections (Stoetzer et al. 2019)

  • Salganik et al. (2020): “Fragile Families Challenge”

    • Asked 160 teams to built predictive models for life outcomes [Material hardship, GPA, Grit, Eviction, Job training, Layoff]
    • “no one made very accurate predictions”
  • SML can be used to predict both missing observations in a dataset, e.g., in Table 1, but also to forecast future observations

    • In latter case we would add a variable \(\text{time }T\) to our dataset

UML in the social sciences

  • Unsupervised machine learning (UML): Methods for finding patterns in data

    • Goal: Classify \(Y_{i}\), e.g., \(Y_{i}^{Lifesat.}\) into groups that are similar
      • \(Y_{i}\) are often texts, images, audio snippets, videos
      • e.g, groups of people with similar life satisfaction
    • Approach: Use model to find lower dimensional representation of \(Y_{i}\) (sometimes using \(X_{i}\))
      • No training, i.e., data-splitting necessary
  • Methods & models: Principal component, factor- , cluster-, latent class and sequence analysis; topic modelling; community detection

  • Examples: Find topics in… newspaper articles (Barberà et al. 2021), open-ended responses (Bauer et al. 2017), academic publications (McFarland et al. 2013), ted talks (Schwemmer & Jungkunz 2019), media discourses (DiMaggio et al. 2013), state documents (Mohr et al. 2013), tweets (Dahal et al. 2019, Bauer); Community detection.. twitter botnets (Lingam et al. 2020)

  • General insights: Social scientists that apply ML are still rare! Distinction between SML and UML sometimes blurry (e.g., pretrained BERT models)

Today’s Presentations/Texts

  • Helbing, D. et al. (2019). Will democracy survive big data and artificial intelligence?. Towards digital enlightenment: Essays on the dark and light sides of the digital revolution, 73-98.
  • Jungherr, Andreas, Gonzalo Rivero, and Daniel Gayo-Avello. 2020. “Data in Politics.” In Retooling Politics: How Digital Media Are Shaping Democracy, 179–211. Cambridge University Press. (Chapter 7 - 7.5)

3 Wahlkampagnen (Election Campaigns and Voter Targeting)

  • Siehe Präsentationen.

4 Normative politische Theorie & Digitalisierung & KI

Today’s Presentations/Texts

  • Coeckelbergh, Mark (2022): The Political Philosophy of AI: An Introduction. Cambridge: Polity, 10-61.

Normative vs. empirische analytische Fragen (1)

  • Welches ist die normative, welches die empirisch-analytische Forschungsfrage?

Normative vs. empirische analytische Fragen (2)

  • …ein Kreislauf!
  • Spezialisierung/Ausdifferenzierung in der Politikwissenschaft

Was ist KI?

  • Machine learning/AI arises from this question: could a computer […] learn on its own how to perform a specified task (Entscheidungen, Aufgaben)? (Chollet and Allaire 2018, Ch. 1.1.2)2


  • Q: Was für Beispiele für KI fallen euch spontan ein? Wo wird KI eingesetzt?

Beispiele (1)

  • Gesundheitswesen
    • Diagnose und Früherkennung: Individuelle medizinische Bildgebungen, Patientenakten → Frühzeitige Erkennung von Krankheiten bei Individuen.
    • Personalisiertes Gesundheitsmanagement: Individuelle Patientendaten, Krankheitsverläufe → Angepasste Behandlungspläne für jeden Patienten.
    • Rückfallprognose: Patientenhistorie, Behandlungsdaten → Vorhersage des Rückfallrisikos bei Patienten.
  • Finanzwesen
    • Kreditbewertung: Individuelle Finanzdaten, Kreditverläufe → Bewertung der Kreditwürdigkeit einzelner Antragsteller.
    • Personalisierte Finanzberatung: Finanzverhalten, Investitionsprofile → Individuelle Anlageempfehlungen.

Beispiele (2)

  • Marketing und Vertrieb
    • Personalisierte Empfehlungen: Kaufhistorie, Browsing-Verhalten → Individuelle Produkt- und Dienstleistungsempfehlungen.
    • Kundensegmentierung: Individuelle Kundendaten, Verhaltensmuster → Zielgerichtete Marketingstrategien für Einzelpersonen.
  • Bildung
    • Bildungserfolgsprognose: Historische Leistungsdaten, demografische Daten → Vorhersage des Bildungserfolgs einzelner Schüler.
    • Intelligente Tutoren: Lernfortschrittsdaten → Personalisiertes Feedback (Datacamp!)
    • Lernanalyse: Individuelle Schülerleistungsdaten → Personalisierte Lernpläne für Schüler.

Beispiele (3)

  • Politik
    • Wählersegmentierung: Demografische Daten, Wählerverhaltensdaten → Identifikation und Ansprache spezifischer Wählergruppen.
    • Werbung und Marketing (Kampagnen): Soziale Medien, Online-Verhaltensdaten → Zielgerichtete Werbekampagnen, Optimierung der Botschaftsverbreitung.
    • Spendensammlung (Kampagnen): Spenderdaten, historische Spendentrends → Vorhersage von Spendenpotenzialen, Identifikation neuer Spendergruppen.
    • Stimmungsanalyse: Soziale Medien, Foren, Blogs → Echtzeit-Analyse der öffentlichen Meinung und Stimmung gegenüber Kandidaten und Themen.
    • Bedrohungsanalyse: Geheimdienstberichte, offene Quellen → Vorhersage von Sicherheitsbedrohungen und Konfliktpotenzialen (Terroristen).
    • Korruptionsbekämpfung: Finanzdaten, Transaktionsdaten → Identifikation und Vorbeugung von Korruption und Missbrauch.
    • Kriminalitätsvorhersage:Kriminalitätsdaten, soziale Daten → Proaktive Polizeimaßnahmen, die zu übermäßiger Kontrolle bestimmter Bevölkerungsgruppen führen können.

KI und normative Bewertung

  • Jede KI-Anwendung sollte evaluiert werden ob sie normativ wünschenswert ist oder nicht (“gut oder schlecht”)
    • Ist der Einsatz von KI zur… Kreditbewertung, Bildungserfolgsprognose, Lernanalyse, Kundensegmentierung, Personalisierte Empfehlungen, Wählersegmentierung usw. wünschenswert oder nicht? Was für Folgen hat er?
    • Norm. Theorie → Definition von Werten und Konfrontation mit KI/Digitalisierung (siehe Mehrabi et al. 2021)
  • Ebene
    • Direkte Folgen für betroffene Person (z.B., bekommt den Kredit nicht)
    • Gesellschaftliche Folgen (z.B., Ungleichheit in Deutschland)
    • Globale Folgen (z.B., Ungleichheit zwischen Ländern, Ausbeutung in Afrika)
    • → dazu brauchts Experten! (z.B., Martin Baesler, euch!)

5 (Öffentliche) Meinungen und soziale Medien (Public Opinion and Social Media)

Wiederholung

  • Wiederholung vorheriger KI-slides
  • AfD & Tiktok Strategie: Impulsvortrag ansehen! Was fällt auf?
  • Referate: Kann man die öffentliche Meinung mit Hilfe sozialer Medien messen/vorhersagen?
    • O’Connor, B., Balasubramanyan, R., Routledge, B., & Smith, N. (2010, May). From tweets to polls: Linking text sentiment to public opinion time series. In Proceedings of the international AAAI conference on web and social media (Vol. 4, No. 1, pp. 122-129).
    • Tumasjan, Andranik, et al. “Election forecasts with Twitter: How 140 characters reflect the political landscape.” Social science computer review 29.4 (2011): 402-418.
      • Jungherr, Andreas, Pascal Jürgens, and Harald Schoen. “Why the pirate party won the german election of 2009 or the trouble with predictions: A response to tumasjan, a., sprenger, to, sander, pg, & welpe, im “predicting elections with twitter: What 140 characters reveal about political sentiment”.” Social science computer review 30.2 (2012): 229-234.

Characteristics of big data (Salganik)

  • Big: Large datasets are a means to an end; they are not an end in themselves.

  • Always-on: Always-on big data enables the study of unexpected events and real-time measurement.

  • Non-reactive: Measurement in big data sources is much less likely to change behavior.

  • Incomplete: No matter how big your big data, it probably doesn’t have the information you want.

  • Inaccessible: Data held by companies and governments are difficult for researchers to access.

  • Nonrepresentative: Nonrepresentative data are bad for out-of-sample generalizations, but can be quite useful for within-sample comparisons.

  • Drifting: Population drift, usage drift, and system drift make it hard to use big data sources to study long-term trends.

  • Algorithmically confounded: Behavior in big data systems is not natural; it is driven by the engineering goals of the systems (the algorithm is a secret!).

  • Dirty: Big data sources can be loaded with junk and spam.

  • Sensitive: Some of the information that companies and governments have is sensitive.

  • Source: Salganik (2017)

6 Politische Partizipation (Political participation)

Wiederholung

  • Wiederholung: Characteristics of big data
  • Sollten man Daten von Social Media Usern für Forschungszwecke verwenden dürfen ohne ihr wissen? (www.digitalpolitics.info)
  • Texte
    • Boulianne, S. (2015). Social media use and participation: A meta-analysis of current research. Information, communication & society, 18(5), 524-538.
    • Lorenz-Spreen, Philipp, et al. “A systematic review of worldwide causal and correlational evidence on digital media and democracy.” Nature human behaviour 7.1 (2023): 74-101. (check updates of 2015 knowledge)

7 Desinformation und Fake News (Disinformation and Fake News)

Hausarbeiten

  • Generell: Dateien immer mit Namen & Titel; Datacamp (!)
  • Themenfindung & Fragestellung
    • Explizite Frage erwünscht! Startpunkt oft Schlussfolgerungen anderer Artikel.
    • Eigener Beitrag (beyond KI)
      • Systematisches Review (Tabellarisch: was für Studien gibt es und wie sind diese aufgebaut?)
      • Neue Analyse von einem Datensatz
      • Interview(s) und Auswertung
      • Qualitative Analyse von Dokumenten (Videos, Tweets) mit Kodierungsschema
      • Zusammenfassung von Argumenten
  • Evaluationskriterien (z.B., zitieren usw.) & Formalien (siehe Syllabus)
  • Recherche Techniken: Was für Tools gibt es? Was für Techniken gibt es? (GoogleScholar, Snowball)
  • Quarto Format & zitieren: https://osf.io/preprints/osf/ur4xn

Hausarbeiten: Beispielfragen

  • Wie beeinflusst die Nutzung von sozialen Medien die politische Meinungsbildung der US-amerikanischen Bevölkerung, unter Berücksichtigung sozio-demografischer Unterschiede? (Amelie)
  • Wie können Sozialkredit-Systeme umweltbewussteres Verhalten der Bürger:innen fördern? (Nina)
  • Wie setzten Parteien Social-Media-Plattformen ein um eine junge Wählerschaft zu generieren? Die AfD und CDU im Vergleich. (Pauline)
  • Wie wird KI in der USA und in der EU reguliert? (Sofia)
  • Wie wird KI in Wahlkampagnen verwendet? Eine Untersuchung der Europwahl und Social Media. (Stephora)
  • Welche Strategie verfolgen russische Social Media Kanäle? Ein Untersuchung am Beispiel von Posts von Russia Today. (Yannik)

Analytische Blickwinkel auf Fake News

  • Was für Forschungsfragen könnten man stellen? (https://app.diagrams.net/)
Insights
  • Akteursfokus: Wer sendet/liest Falschinformationen?
  • Inhaltsfokus: Welche Falschinformationen breiten sich aus?
  • Netzwerkfokus: Wie (schnell) breitet sich die Falschinformation im Netzwerk aus? Wer sind zentrale Akt
  • Plattformfokus: Auf welchen Plattformen breitet sich die Falschinformation aus?
  • Kombination aus unterschiedlichen Foki usw.

8 Politikgestaltung und Regierungsführung (Policy Making and Governance)

9 (Politische) Repression und Überwachung (Political Repression & Surveillance)

  • Braucht es eine Einführung?

10 Blockchain & DLT

Was ist Blockchain?

  • Digitaler Ledger/Digital Ledger (glorified excel sheet): Ein digitales Notizbuch , in dem Transaktionen aufgezeichnet werden
  • Blöcke/Blocks: Transaktionen werden in digitalen Containern, den sogenannten Blöcken, gespeichert
  • Kette/Chain: Jeder Block ist mit dem vorherigen verbunden, wodurch eine Kette entsteht

Source: https://www.geeksforgeeks.org/blockchain-structure/

  • Dezentralisiert/Decentralized: Daten sind auf viele Computer (Knoten) weltweit verteilt
  • Sicher/Secure: Es ist schwierig, Informationen zu ändern, ohne die gesamte Kette zu beeinflussen
  • Transparent/Transparent: Transaktionen sind für jeden im Netzwerk sichtbar

Hauptmerkmale der Blockchain

  • Unveränderlich/Immutable: Sobald Daten aufgezeichnet sind, können sie nicht mehr leicht geändert werden
  • Verteilt/Distributed: Mehrere Kopien der Blockchain existieren auf verschiedenen Knoten (nodes)/Computern
  • Konsensmechanismus/Consensus Mechanism: Übereinstimmung unter den Knoten (nodes) zur Validierung von Transaktionen

Was sind Smart Contracts?

  • Selbstausführende Verträge/Self-Executing Contracts: Verträge mit Bedingungen, die direkt in Code geschrieben sind.
  • Automatisierte Ausführung/Automated Execution: Automatische Ausführung von Aktionen, wenn vordefinierte Bedingungen erfüllt sind
  • Dezentralisiert/Decentralized: Funktionieren auf einer Blockchain und werden nicht von einer einzigen Entität kontrolliert
  • Transparent: Der Code und die Ausführung sind für alle Teilnehmer sichtbar
  • Unveränderlich/Immutable: Sobald sie bereitgestellt sind, kann der Vertragscode nicht geändert werden
  • Vertrauenslos/Trustless: Beseitigt die Notwendigkeit für Zwischenhändler (z.B. Anwälte, Banken)

Hauptmerkmale von Smart Contracts

  • Effizienz/Efficiency: Schnellere Ausführung ohne manuelles Eingreifen
  • Sicherheit/Security: Verschlüsselt und sicher auf der Blockchain
  • Kostenersparnis/Cost-Effective: Reduziert Kosten, die mit der traditionellen Vertragsabwicklung verbunden sind

Wie Blockchain und Smart Contracts zusammenarbeiten

  • Grundlage/Foundation: Blockchain bietet die sichere, transparente Infrastruktur
  • Automatisierung/Automation: Smart Contracts automatisieren und erzwingen Vereinbarungen

Beispiel: Hauskauf

  1. Vereinbarung/Agreement: Käufer und Verkäufer einigen sich auf Bedingungen, die in einem Smart Contract kodiert sind
  2. Ausführung/Execution: Der Vertrag überträgt automatisch das Eigentum, sobald die Zahlungsbedingungen erfüllt sind
  3. Verifizierung/Verification: Die Blockchain stellt sicher, dass alle Transaktionen sicher und transparent sind
  • Vorteile: reduziert Betrug; strafft Prozesse; sichert die Einhaltung

Referate & Datacamp

  • Referate: Link zu den Folien
  • Online einsichtig wer die Kurse gemacht hat (Achtung: Name vorhanden?)
    • Am besten auch Zertifikate an mich schicken (bis “Hypothesis Testing in R”)

Hausarbeiten

  1. Allgemeine Anmerkungen
  2. Bewertungskriterien
  3. Themenauswahl
  4. Formalia
  • Gliederung: Einleitung; Hauptteil: Theorie & Evidenz, Methoden, Resultate; Schluss

Warum lassen wir Hausarbeiten schreiben?

Hausarbeit = vertiefende Auseinandersetzung mit Themen, die im Seminar besprochen wurden

  • Fokus: Beantwortung einer relevanten Forschungsfrage
  • Ziel: Erwerb von Schlüsselqualifikationen
  1. Logische, politikwissenschaftlich relevante Argumentation
  2. Recherchieren, sichten und bewerten von empirischen Daten (z.B., Studien3, Dokumente4, Interviews, Umfragedaten) und relevanter Literatur
  3. Anwenden wissenschaftlicher Arbeitstechniken (z.B. zitieren, daten analysieren)

Einleitung: Aufbau

  1. Allg. Einführung (oft gesellschaftliche Relevanz)
  2. Forschungsfrage (vll. kurz Vorgehensweise & Methode.. wie beantwortet?)
  3. Wissenschaftliche Relevanz des Themas (euer Beitrag!)
  4. Überblick über die Kapitel

Einleitung: Was ist eine gute Forschungsfrage?

Hauptteil: Theorie & Evidenz, Methoden, Resultate

  • Theorie & Evidenz
    • Deduktive Anwendung eines theoretischen Konzeptes auf empirische Fälle
    • Diskussion von vorheriger Forschung
    • Theorie und Empirie sinnvoll verknüpfen
    • Theoriekapitel soll zur Beantwortung der Forschungsfrage beitragen
    • Beibehaltung eines “roten Fadens”
  • Methoden: Beschreibung der methodischen Vorgehensweise
  • Resultate: Beschreibung der Ergebnisse (z.B. Hypothesen bestätigt oder verworfen?)

Schluss

  • Zentrale Forschungsfrage beantworten.
  • Ergebnisse zusammenfassen und mit anderen Studien kontrastieren (sofern es welche gibt)
  • “Roter Faden” beibehalten
  • Thesen aus dem Hauptteil verifizieren oder falsifizieren
  • Generalisierbarkeit der Ergebnisse diskutieren
  • Politikwissenschaftliche und politische Implikationen einschätzen

Bewertungskriterien für Hausarbeiten (1)

  • Aufbau und Struktur
    • Klare Herleitung der Fragestellung
    • Struktur, die auf die zentrale Fragestellung hinarbeitet
    • Zusammenfassung der Ergebnisse im Schluss
  • Logik und Stringenz
    • Klarer roter Faden
    • Sinnvolle Gliederung
    • Objektive und präzise Argumentation

Bewertungskriterien für Hausarbeiten (2)

  • Auswertung und Einarbeitung Literatur
    • Zitation einschlägiger Quellen
    • Nutzung unterschiedlicher Quellenarten
  • Politikwissenschaftliche Terminologie
    • Exakte Verwendung von Begriffen
    • Saubere Definition von Schlüsselbegriffen
  • Sprache
    • Verständlichkeit und Lesbarkeit
    • Exakte und unzweideutige Formulierung
  • Kritieren, die mir noch wichtig sind (je nach Anwendbarkeit)

Hinweise zur Abgabe & formaler Gestaltung (1)

  • Abgabedatum: Datum siehe Syllabus (23.59 Uhr)
  • Einreichung: Elektronisch als PDF + *qmd file (+ Daten falls applicable) per Email an paul.bauer@politik.uni-freiburg.de
  • Dateibenennung: „Nachname – Titel der Arbeit.pdf/qmd“
  • Umfang: 10-12 Seiten Text ohne Grafiken/Tabellen/Deckblatt/Appendix/Erklärung (alles weitere in den Appendix!)
  • Deckblatt
    • Name, Studiengang, Semesterzahl, Adresse, Email-Adresse
    • Angaben zur Lehrveranstaltung: Institut/Lehrstuhl, Thema, Dozent, Semester
    • Thema der Arbeit
    • Ort und Datum der Abgabe

Hinweise zur Abgabe & formaler Gestaltung (2)

  • Literaturverzeichnis

  • Format

    • Schriftart: Times New Roman; Schriftgröße: 12pt; Zeilenabstand: 1,5; Blocksatz, Seitenrand: 2,5cm; Seitenzahlen ab der Einleitung
      • Quarto -> PDF (unterliegendes mit Quarto abgeben, siehe Vorlage 1, Vorlage 2)
        • [Ausnahme -> Statistikübung noch nicht absolviert]
  • Verwendung von AI/ChatGPT

    • Genaue Dokumentation des Chats & Abgabe des Chats

Bibliographie

Chollet, Francois, and J J Allaire. 2018. Deep Learning with R. 1st ed. Manning Publications.
Hilbert, Martin, and Priscila López. 2011. “The World’s Technological Capacity to Store, Communicate, and Compute Information.” Science 332 (6025): 60–65.
Mayer-Schönberger, Viktor, and Kenneth Cukier. 2012. Big Data: A Revolution That Transforms How We Work, Live, and Think. Boston: Houghton Mifflin Harcourt.
Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. Princeton University Press.
Salganik, Matthew J, Ian Lundberg, Alexander T Kindel, Caitlin E Ahearn, Khaled Al-Ghoneim, Abdullah Almaatouq, Drew M Altschul, et al. 2020. “Measuring the Predictability of Life Outcomes with a Scientific Mass Collaboration.” Proc. Natl. Acad. Sci. U. S. A. 117 (15): 8398–8403.

Footnotes

  1. “We estimated the world’s technological capacity to store, communicate, and compute information, tracking 60 analog and digital technologies during the period from 1986 to 2007. In 2007, humankind was able to store 2.9 × 1020 optimally compressed bytes, communicate almost 2 × 1021 bytes, and carry out 6.4 × 1018 instructions per second on general-purpose computers. General-purpose computing capacity grew at an annual rate of 58%. The world’s capacity for bidirectional telecommunication grew at 28% per year, closely followed by the increase in globally stored information (23%). Humankind’s capacity for unidirectional information diffusion through broadcasting channels has experienced comparatively modest annual growth (6%). Telecommunication has been dominated by digital technologies since 1990 (99.9% in digital format in 2007), and the majority of our technological memory has been in digital format since the early 2000s (94% digital in 2007).”

  2. Rather than programmers crafting data-processing rules by hand, could a computer automatically learn these rules by looking at data?

  3. Neben Zusammenfassungen im Text bitte tabellarische Übersicht.

  4. Neben Zusammenfassungen im Text bitte tabellarische Übersicht.