this post was submitted on 24 Jun 2023
61 points (95.5% liked)
DACH - jetzt auf feddit.org
8713 readers
1 users here now
Diese Community wird zum 01.07 auf read-only gestellt. Durch die anhäufenden IT-Probleme und der fehlende Support wechseln wir als Community auf www.feddit.org/c/dach - Ihr seid herzlich eingeladen auch dort weiter zu diskutieren!
Das Sammelbecken auf feddit für alle Deutschsprechenden aus Deutschland, Österreich, Schweiz, Liechtenstein, Luxemburg und die zwei Belgier. Außerdem natürlich alle anderen deutschprechenden Länderteile der Welt.
Für länderspezifische Themen könnt ihr euch in folgenden Communities austauschen:
Eine ausführliche Sidebar findet ihr hier: Infothread: Regeln, Feedback & sonstige Infos
Auch hier gelten die Serverregeln von https://feddit.de !
Banner: SirSamuelVimes
founded 1 year ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Sind sie das? Was sind denn die standard Preise für KI Kunden?
Gibt's nicht weil die ihre Trainings daten mit Scrapern holen, und die brauchen keinen bidirektionalen Kanal, die brauchen einfach nur alle Daten ein mal, da lohnt es sich nichtmal die api zu benutzen.
Sehe ich anders, habe aber auch keine Expertise auf dem Gebiet.
Scraper sind schlecht für die IT Infrastruktur, gleichzeitig sind sie auch nerviger zu entwickeln als eine API zu verwenden. Es kann gut sein dass sich Reddit mit der Industrie auf einen Mittelweg geeinigt hat, anstatt ein Wettrüsten zu veranstalten. Evtl gibt auch legale Probleme gescrapte Daten zu verwenden. Anderalls wäre es mir unklar wieso sie die Preise anheben, und nicht einfach die API abstellen.
Kannst du das auch belegen?
Es geht halt grundsätzlich viel schneller als sich erst mit einer api rum zu schlagen, du brauchst die Daten ja nur ein mal. Und dann benutzen diese Unternehmen eben auch selbst KI die erkennt welche Daten relevant für Mashine learning sind, was mit KI Scrapern besser geht, die Firmen die das machen sind relativ verschwiegen was das sourcing angeht, und meine Quelle dazu ist das einer meiner freunde bei einer training data machenden firma arbeitet und mir deren system mal erklärt hab, die Quelle ist eben nirgends nieder geschrieben. Du musst mir diesbezüglich also nicht glauben, wenn du aber eine Quelle findest die etwas anderes behauptet (die nichts mit Reddit oder Twitter zu tun hat) würde ich mir das gern anschauen, ich binn schließlich auch nicht unfehlbar und Quelle: "Vertrau mir brudi" ist halt Kaum belegbar.