Anfängerfragen - Einigermassen dringend. ;)

  • 10 Antworten
  • Letztes Antwortdatum
D

DrRadon

Neues Mitglied
0
Heyo,

ich stelle morgen (ja, ich weis ich bin spät dran, habe mich ewig aufs Konzept Fokussiert) einen Antrag auf Fördergelder für eine App die Kindern Spielerisch helfen soll.

Die App soll im Idealfall sowohl auf Android als auch auf iOS funktionieren. - Muss ich hierfür etwas kaufen? (Ich denke immer an Unity wenn ich an Multiplattform denke, habe aber unterm strich keine Ahnung was es sonst noch gibt).

Damit die Kinder den Prototypen der App testen können würde ich gerne sowohl Apple als auch Android Testgeräte kaufen. Bei Android bin ich mir leider sehr unsicher welche Geräte sinnvoll wären... Pixel direkt von Google weil es das pure Android ist? Amazon Fire weil es das meist verkaufte Tablet ist? Was würdet ihr sagen?

Ich möchte der Selfi Technik aus Snapchat in einem neuen Program einen Sinn geben der über Spass hinaus geht. Muss ich eine Datenbank kaufen um diese "Selficam" Technik nutzen zu können?

Auch soll die App in der Lage sein anhand von Lauten bzw. Worten die der Nutzer von sich gibt reagieren. Gibt es hier Sprachdatenbanken die ihr empfehlen könnt? Was kosten sie?

Da ich selbst überhaupt nicht Programmieren kann brauche ich einen Programmierer der das ganze zu einem Prototypen zusammenbauen kann. Was denkt ihr sollte die Grundsätzliche Schaffung eines Userinterfaces, das einbinden von Animationen, Sprachausgabe und Schlussendlich 2-8 Übungen mit Sprach und Gesichtserkennung kosten? (Zeitraum für die Umsetzung c.a. 6-12 Monate, Beginn meiner Förderung wäre im November).

Maximale Fördergeldmenge ist 10.000€ - das heist nicht das mir die auch garantiert zustehen, ich muss denen Sinnvolle kosten nennen die dann bewilligt werden.

Das ganze ist teil eines Uniprojekts das sowohl als Abschlussarbeit für mich fungiert als auch als Firmengründung. Entsprechend wäre ein durch diese Gelder bezahlter Programmierer nicht Vollzeit angestellt. Für iOS hatte ich mal jemanden der mir grob 500€ als Angebot gemacht hat (nach dem Motto, klingt cool, ist machbar, wird aber etwas dauern und ich muss die Zeit irgendwo rechtfertigen können).

Grundsätzlich wäre ein einstieg in die "Firma" natürlich auch möglich.

Um die Grafik und Musik kümmern ich mich anderweitig. Seht die Frage hier als reine auf den Programiertechnischenbereich beschränkt.



Große Testclouds würde ich erst für die im Anschluss geplante Exist Förderung einplanen, erstmal muss der Bums als Prototyp zum laufen gebracht werden.

Würde mich super über euer feedback freuen.
 
DrRadon schrieb:
Heyo,
Die App soll im Idealfall sowohl auf Android als auch auf iOS funktionieren. - Muss ich hierfür etwas kaufen? (Ich denke immer an Unity wenn ich an Multiplattform denke, habe aber unterm strich keine Ahnung was es sonst noch gibt).
Am besten, insbesondere wenn du wie hier mit Kamera und Sprache arbeiten willst, sind immer 2 getrennte Apps. Also iOS nativ und Android nativ programmieren. Wenn es wirklich Hybrid sein sollte ist denke ich Xamarin eine gute Wahl. Mit Xamarin kann man erstmal kostenlos starten.

DrRadon schrieb:
Damit die Kinder den Prototypen der App testen können würde ich gerne sowohl Apple als auch Android Testgeräte kaufen. Bei Android bin ich mir leider sehr unsicher welche Geräte sinnvoll wären... Pixel direkt von Google weil es das pure Android ist? Amazon Fire weil es das meist verkaufte Tablet ist? Was würdet ihr sagen?
Das ist erstmal relativ gleich. Nach einer Zeit wirst du immer das eine Gerät nachkaufen müssen, dass Probleme macht. Wenn es auf dem Fire laufen soll macht es sicher Sinn ein Android Telefon mit Google zu kaufen und zusätzlich das Fire, da sich das Ökosystem doch etwas unterscheidet.

DrRadon schrieb:
Ich möchte der Selfi Technik aus Snapchat in einem neuen Program einen Sinn geben der über Spass hinaus geht. Muss ich eine Datenbank kaufen um diese "Selficam" Technik nutzen zu können?
Die Kamera kann man einfach so verwenden. Was soll deiner Meinung nach in der Datenbank sein? Filter? Die müsstest du denke ich selbst programmieren (lassen).

DrRadon schrieb:
Auch soll die App in der Lage sein anhand von Lauten bzw. Worten die der Nutzer von sich gibt reagieren. Gibt es hier Sprachdatenbanken die ihr empfehlen könnt? Was kosten sie?
Software zur Spracherkennung inklusive Trainingssets gibt es sicher, kenne ich mich aber nicht aus.

DrRadon schrieb:
Da ich selbst überhaupt nicht Programmieren kann brauche ich einen Programmierer der das ganze zu einem Prototypen zusammenbauen kann. Was denkt ihr sollte die Grundsätzliche Schaffung eines Userinterfaces, das einbinden von Animationen, Sprachausgabe und Schlussendlich 2-8 Übungen mit Sprach und Gesichtserkennung kosten? (Zeitraum für die Umsetzung c.a. 6-12 Monate, Beginn meiner Förderung wäre im November).
[...]
Für iOS hatte ich mal jemanden der mir grob 500€ als Angebot gemacht hat (nach dem Motto, klingt cool, ist machbar, wird aber etwas dauern und ich muss die Zeit irgendwo rechtfertigen können).
Das halte ich für ein sehr gewagtes Angebot des Entwicklers. Natürlich kann ein Student oder jemand der nicht davon leben muss immer bessere Angebote machen, aber die Frage ist dann was rauskommt.
Schätzungen sind immer schwierig, aber unter 10 Manntage für deine Protoyp-Anforderung würde ich nicht guten Gewissens schätzen. In meiner Firma kostet ein Manntag ca. 1100€ (und sind da eher noch auf der billigen Seite), ich denke jemand der selbständig ist, könnte es vielleicht schon für 500€ den Tag machen.
 
  • Danke
Reaktionen: swa00 und DrRadon
Vielen Dank für deine schnelle und ausführliche Antwort.

DrRadon schrieb:
Ich möchte der Selfi Technik aus Snapchat in einem neuen Program einen Sinn geben der über Spass hinaus geht. Muss ich eine Datenbank kaufen um diese "Selficam" Technik nutzen zu können?
Die Kamera kann man einfach so verwenden. Was soll deiner Meinung nach in der Datenbank sein? Filter? Die müsstest du denke ich selbst programmieren (lassen).

Es geht mir hier um die Gesichtserkennung und das ich in der Lage bin Grafiken, Vektoren und Animationen einzufügen. Das muss man vermutlich nicht von null auf Programmieren nehme ich an.
Den Hinweis darauf das eine native Programmierung besser ist finde ich toll, dann müsste ich aber sicher darauf achten das eventuelle Datenbanken für Spracherkennung oder Gesichtserkennung auch für beide Betriebssysteme verfügbar sind nehme ich an? Würde mich sehr freuen wenn mir hier jemand Code empfehlen könnte den es Gratis oder für Geld gibt. :)

Das halte ich für ein sehr gewagtes Angebot des Entwicklers. Natürlich kann ein Student oder jemand der nicht davon leben muss immer bessere Angebote machen, aber die Frage ist dann was rauskommt.
Schätzungen sind immer schwierig, aber unter 10 Manntage für deine Protoyp-Anforderung würde ich nicht guten Gewissens schätzen. In meiner Firma kostet ein Manntag ca. 1100€ (und sind da eher noch auf der billigen Seite), ich denke jemand der selbständig ist, könnte es vielleicht schon für 500€ den Tag machen.

Da ist dann im wesentlichen die Frage wieviel Zeit die Umsetzung braucht, ich vermute allerdings das ich keine 8000€ ins Budget bekomme um die nem Programmierer zu geben und gehe davon aus das sieben Tage nicht genug wären für einen Prototypen. Aber was weis ich schon vom Programmieren. :)
 
Hallo Radon ,

da ich selbst eine SpracherkennungsApp am start habe , kann ich dir dazu nur mitteilen , dass diese Umsetzung
für einen erfahrenen Entwickler mindestens 20 - 30 Tage benötigt.
Alleine die Erstellung der verschiedenen Erkennungsmodell der Kommandos benötigt sehr viel Praxiserfahrung in dieser Materie und Zeit.

@deek

Ja, 1100,-- pro Manntag sind schon sehr wohlwollend :)
 
Den Hinweis darauf das eine native Programmierung besser ist finde ich toll, dann müsste ich aber sicher darauf achten das eventuelle Datenbanken für Spracherkennung oder Gesichtserkennung auch für beide Betriebssysteme verfügbar sind nehme ich an? Würde mich sehr freuen wenn mir hier jemand Code empfehlen könnte den es Gratis oder für Geld gibt. :)

Nativ finde ich persönlich auch (fast) immer besser. Aber dazu kannst du dir genug bei dr. google suchen. Spracherkennung ist ein schönes Feld. Zwischen Laute und Worte ist ein unterschied. Bei der Erkennung von Lauten kenne ich mich nicht so aus. Gibt aber gute Paper und arbeiten dazu aus den frühen 2000er. Wenn du Worte erkennnen möchtest und darauf hin Befehle ausführen möchtest ist dies easy doing. Jeder größerer Player bietet da imo was an. Wenn es deutsch werden soll würde ich zu MS oder Google tendieren. api.ai ist da bestimmt ein guter Anfang. Aber dir sollte klar sein, das dies cloud Dienste sind. Wenn du etwas lokales brauchst, kenne ich nur CMUSphinx und davon halt ich nicht viel.

Eine App zu erstellen, die mit der Sprache bedient werden kann, dauert bestimmt keine 20-30 Tage ;) vllt. mehr so 2-3 Tage =) (Sonst würde ja niemand für alexa oder Google assistent programmieren :D)

lg. Dagobert
 
Der TE hat folgendes vor - Nur zur Erinnerung

Software zur Spracherkennung inklusive Trainingssets gibt es sicher, kenne ich mich aber nicht aus.

Du schreibst :

Eine App zu erstellen, die mit der Sprache bedient werden kann, dauert bestimmt keine 20-30 Tage ;) vllt. mehr so 2-3 Tage =) (Sonst würde ja niemand für alexa oder Google assistent programmieren :D)

a) wie kommst du zu dieser Aussage ?
b) Selbst schon mal mit offline PCM Trainings-Modellen gearbeitet ?
c) Auch schon eine App mit so einer Technik im Vertrieb ??

Kleiner Hinweis : es geht NICHT um einen Kommando befehl und danach die neuronale Auswertung auf einem externen Server , es geht hier
um die das offline PCM Training.

Und bekanntlich kann man die Spracherkennung von Google oder Alexa nicht trainieren
 
Der TE schreibt:
Auch soll die App in der Lage sein anhand von Lauten bzw. Worten die der Nutzer von sich gibt reagieren. Gibt es hier Sprachdatenbanken die ihr empfehlen könnt? Was kosten sie?
Dafür hab ich in einen (oder mehrere) Wege genannt. Und vor allem in einer ganz anderen Preisspanne als dein Vorhaben!
 
Richtig , aber er klammert durch diese Aussage doch das Training nicht aus ( oder habe ich was übersehen ?)

Deine Lösung wäre allerdings ohne Training , mit der Standard-Recognition -
und da gebe ich dir recht , wenn du 2-3 Tage ansetzt - in dem Falle vielleicht auch weniger.

Aber Training , incl. sampeln und Modelle erstellen - das wird definitiv nix mit 2-3 Tagen

P.S Sphinx - da kann ich dir nur uneingeschränkt zustimmen :)
(Damit bin ich ordentlich auf dem Bauch gelandet)
 
Zuletzt bearbeitet:
@swa00
Da gebe ich dir recht. Wenn man das alles benötigt, ist das ganze um X aufwändiger.
Deswegen habe ich ja die Paper aus den frühen 2000er erwähnt. Da steht sehr viel nützliches Zeugs zu dem Thema drin. Gerade für weiter Forschung. The vocal joystick und wie sie nicht alle heißen sind hier bestimmt gute Einstiegspunkte. Aber für eine "Sprachsteuerung" der App ist dies alles nicht mehr Nötigt. Und ja, auch Alexa und Api.ai lassen sich "trainieren". Alexa durch Beispielsätze & Custom-Slots. Api.ai geht da meines Wissens nach noch ein bisschen weiter.
Und ja ,ich habe keine App mit Sprachsteuerung im Store bei Android (zumindest noch nicht). Dafür hab ich die ein oder anderen Alexa Skills und Actions for Google fertig.

Wenn es einfach um Verarbeitung von Wörtern und Sätzen geht, spart es eine Menge Zeit, Nerven und Geld wenn man einen Dienst dafür benutzt. Wenn man einen höheren Dienst verwendet, bekommt man sogar direkt das geschenkt, woran man eigentlich interessiert ist.
Wenn es um Laute geht, kenne ich mich in der Praxis nicht aus, sondern kenne nur die alten Grundlagen und theoretisches Zeugs.

Im Endeffekt muss der TE entscheiden was er möchte/braucht.
 
  • Danke
Reaktionen: swa00
Und ja, auch Alexa und Api.ai lassen sich "trainieren". Alexa durch Beispielsätze & Custom-Slots. Api.ai geht da meines Wissens nach noch ein bisschen weiter.

Klingt seeeeeehr interessant - wusste ich bis dato nicht :

Hast du zufällig mal was zum Lesen dazu ? ( Link)

Ich wäre dankbar
 
@swa00

Den direkten Link nicht gerade nicht zur Hand. Aber in der Alexa Doku sollte sich das relativ schnell finden lassen. Bei api.ai kenne ich die offizielle Doku nicht, da dies nur ein Google Clon von Amazons Alexa Dev Umgebung ist und sehr vertraut wirkt.

Aber ich denke der Thread (oder das Forum^^) ist der falsche Ort für solche infos.
Es sollte mal wieder back to topic gehen.
 
  • Danke
Reaktionen: swa00

Ähnliche Themen

H
Antworten
4
Aufrufe
797
HTCUserRay
H
H
Antworten
2
Aufrufe
912
Heribert500
H
Zurück
Oben Unten