Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feature Request: Unterstützung für Staffel/Episode Daten #942

Open
ChristianKuehnel opened this issue Nov 7, 2023 · 12 comments
Open

Feature Request: Unterstützung für Staffel/Episode Daten #942

ChristianKuehnel opened this issue Nov 7, 2023 · 12 comments

Comments

@ChristianKuehnel
Copy link

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

@dadidadit
Copy link

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

Immer noch ist gut ;) . Gottseidank hat die ARD seit der Übernahme der Sendungen vom ZDF ebenso bis auf wenige Ausnahmen SCHON IMMER im Titel gahabt. _

@ChristianKuehnel
Copy link
Author

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Dann habe ich mich da geirrt. Entschuldigung.

Die Informationen zur Staffel/Episode sind irgendwo vorhanden (auf der Webseite werden sie angezeigt) und es wäre super, wenn jemand einen Weg finden würde diese zu extrahieren.

@vitusson
Copy link

vitusson commented Nov 7, 2023

Das ZDF macht das wie es gerade Lust hat. Je naach Mondstand, Sonnenscheindauer geteilt durch Redakteursalter und Tagesform.
Da war noch nie was konsistent.
Es gibt Serien die vorbildlich mit S01E0X getagt sind, andere einfach nur mit Titel und Folgennummmer darf man sich selber suchen. Ich sehe nicht was MV daran ändern könnte, die Rohdaten vom ZDF sind shice, Punkt.

@codingPF codingPF transferred this issue from mediathekview/MediathekView Nov 7, 2023
@codingPF
Copy link
Member

codingPF commented Nov 7, 2023

Ich glaube hier ist besser aufgdhoben

@ChristianKuehnel
Copy link
Author

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Woher (welche API/Webseite/...) bezieht denn MediathekView die Inhalte beim ZDF? Ist das ein Webscraper? Oder hat das ZDF eine API dafür?

@dadidadit
Copy link

dadidadit commented Nov 8, 2023

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Dann such mal schön. Und wenn du fündig sein solltst, kannst du den Entwicklern, die sich bisher immer große Mühe gegeben haben und einfach nichts finden (wollen?) ganz toll erklären, wie einfach das doch war , wenn das ZDF diese Informationen nicht zur Verfügung stellen will. Noch nicht einmal im eigenen erzeugten und veröffentlichten Videotext im Fernsehprogramm findest du dazu irgend etwas zu Staffel und Folge ....
Im einfachsten Fall holst du dir die gewünschten Serientitel mit fehlenden Infos einfach aus dem ARD-Link oder gehts auf die Webseite in der ZDF-Mediathek und schaust sie dir da ab. Das geht nämlich ganz einfach: Klick auf den "Link zur Webseite".

@codingPF
Copy link
Member

codingPF commented Nov 8, 2023

Dinge ändern sich und es kann nicht schaden (auch bekannte) Themen noch zu durch denken

@pidoubleyou
Copy link
Contributor

ja, das ZDF hat die Infos tatsächlich explizit mittlerweile in seiner Datenstruktur:
Screenshot from 2023-11-08 21-50-16

Eine Erweiterung in diese Richtung wäre durchaus mal denkbar.

@ChristianKuehnel
Copy link
Author

ChristianKuehnel commented Nov 9, 2023

@dadidadit Ich finde deinen Tonfall sehr unfreundlich und unangemessen bezogen auf mein Angebot Zeit zu investieren um das Tool zu verbessern.

@pidoubleyou Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

@pidoubleyou
Copy link
Contributor

Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

über die ZDF-API. wenn du die Filmseite bei ZDF aufrufst, findest du einen JSON-Request mit folgender Url: https://api.zdf.de/content/documents/zdf/serien/solo-fuer-weiss/solo-fuer-weiss---liebeswut-102.json

Den zugehörigen Deserializer findest du im Code hier.

@codingPF
Copy link
Member

ich habe mal ein paar Zeilen code rein gebaut...hier der output (random sample) um mal einen Eindruck zu bekommen....NO EPISODE habe ich drin gelassen damit man verstehen kann wie oft das Feld gefüllt ist. Das sieht schon sehr nett aus aber hat auch eine großen imapact...

Blinky Bill#Cranky, der Clown -  (NO EPISODE)
Doku#Vom Freiwilligenjahr zum eigenen Hostel in Afrika - Abenteuer Auswandern in Tansania (NO EPISODE)
In aller Freundschaft#Verpasste Gelegenheiten -  (NO EPISODE)
Bares für Rares#Bares für Rares vom 6. November 2023 - Die Trödel-Show mit Horst Lichter #SE2023#EP256
Löwenzahn#Hühner - Das große Gackern #SE42#EP371
Abendschau - Der Süden#Sendung 09.11.2023 · Das Wichtigste aus Südbayern -  (NO EPISODE)
Death in Paradise#Rückschwung #SE11#EP4
heute#Gedenkfeier zur Reichspogromnacht (NO EPISODE)
ZDFinfo Doku#Murderous History: Der Teufel von Chicago - Rätselhafte Verbrechen #SE2022#EP3
Volle Kanne#Blühendes für den Winter - Tipps von Elmar Mai zu Weihnachtssternen und Amaryllis (NO EPISODE)
SWR1 Leute#Inna Hartwich - Moskau-Korrespondentin - Russland: Darum begehren die Menschen nicht auf -  (NO EPISODE)
Terra X#Welten-Saga - Die Schätze Indiens - Folge 2 der sechsteiligen Dokureihe mit Christopher Clark #SE1#EP2
ZDFinfo Doku#Murderous History: Die Leichenräuber von Edinburgh - Rätselhafte Verbrechen #SE2022#EP2
SWR Aktuell Baden-Württemberg#Sendung 19:30 Uhr vom 6.11.2023 -  (NO EPISODE)
KiKANiNCHEN#Der Krebs -  (NO EPISODE)
Leschs Kosmos#Der Schatz in der Mülltonne - Das Recycling-Versprechen #SE2022#EP7
Insectibles#10. Das große Leuchten -  (NO EPISODE)
heute journal update#Fiedler: "Personal nach wie vor knapp" (NO EPISODE)
Panorama#"The Marvels": Diverser Cast und Actionszenen (NO EPISODE)
Terra X#Überleben – Planet im Wandel - Dokureihe mit Dirk Steffens #SE19#EP5
ZDFinfo Doku#Geheimes Saudi-Arabien - Aufbruch und Unterdrückung  #SE1#EP3
Doku & Reportage#Von der Fabrik zur Kunst -  (NO EPISODE)

@ChristianKuehnel
Copy link
Author

Danke für die Links!

Ich versuche mal zusammenzufassen, was zu tun wäre:

  • Crawler:
    • Vom ZDF bekommen wir bei einigen Serien/Folgen die Daten geliefert, bei anderen nicht.
    • Bei der ARD könnte man dieselbe Information mit einer Heuristik (S01/E02) aus dem Titel raten. Wird manchmal funktionieren und manchmal auch nicht.
    • Weitere Sender müsste man sich einzeln anschauen.
  • Datenmodell:
    • Man müsste das gesamte Datenmodell an diversen Stellen um die entsprechenden Attribute erweitern.
    • Nachdem das eine größere Änderung ist müsste man das irgendwie rückwärtskompatibel gestalten, insbesondere damit ältere SW-Versionen sich nicht an den neuen Daten verschlucken.
  • Frontends:
    • Man müsste das Java und das Webfrontend erweitern, damit dort die zusätzlichen Daten dort auch angezeigt und gefiltert/sortiert werden können.

Das klingt tatsächlich nach einer größeren Aktion. Seht ihr da einen Mehrwert, der den Aufwand rechtfertigt?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants