- Statistika a analýza přehrávání jednotlivých částí přednášky. Napište modul, který bude sbírat statistiky, jak uživatelé přehrávají záznamy. Jestli přeskakují z místa na místo nebo poslouchají. Zobrazte posbírané statistiky.
- Převod PDF do textu. Nyní používáme Tesseract OCR od Googlu. Pro anglické texty funguje relativně dobře. Posbírejte nebo vygenerujte dostatečné množství textů a vylepšete OCR rozpoznávání. Můžete zapracovat i na postprocessingu rozpoznaného textu.
- OCR slidů. OCR teď nad textovými dokumenty alespoň nějak funguje. Se slidy už to je horší. Natrénujte OCR, které bude schopné přepsat obsah slidů do textu. Pokud přijdete s lepším přístupem než je OCR, budete vítáni. Jako zdroj předpokládejte PDF.
- Automatická detekce slidů a jejich změny. V systému již umíme najít plátno a v něm detekovat změnu slidu. Slidy jsou pak synchronizovány s dodaným PDF. Současná implementace má však rezervy (nefunguje úplně přesně). Vaším úkolem bude vylepšit aktuální stav.
- Identifikace podobných (relevantních) částí záznamů na základě přepisu a/nebo klíčových slov. Zkuste automaticky propojit části různých přednášek a kurzů, které se týkají stejného tématu. Můžete vaše vazby také vizualizovat pomocí grafu. Ideální bude, když se vám podaří takto propojit i textové opory a slidy.
- Export vybraných informací do videa. Umožněte uživatelům vyexportovat si video s titulky, komentáři, slidy, klíčovými slovy, podporami, ...
- Propojení se sociálními sítěmi. Po označení některých kurzů, přednášek nebo komentářů bude portál automaticky informovat uživatele o novinkách nebo změnách skrze RSS/Twitter/email/Facebook.
- Automatická extrakce klíčových frází. Máme implementovanou detekci klíčových frází v PHP/MySQL. Vaším úkolem bude přeimplementovat ji do C++ a také vylepšit.
- Modul pro střih videa. Uživatel může sestříhat vlastní zhuštěnou verzi přednášky.
- Sémantický web. Vaším úkolem bude napojit Prednasky.com na dbpedia.org (například) a umožnit vyhledávat sémanticky. Pro nalezení klíčového slova Fourierova transformace bude možné zadat buď Fourierova transformace nebo FT.
- Detekce laserového ukazovátka nebo kurzoru myši. Pokud se ve videu pohybuje kurzor myši a nebo tam je vidět bod laserového ukazovátka znamená to, že přednášející chce na něco upozornit. V málo kvalitním videu se kurzor kvůli kompresi ztratí. Můžete, zkusit zvýraznit dané místo pomocí vložené grafiky (elipsa) a uchovat tuto informaci.
- Identifikace a náprava bezpečnostních chyb. Podrobte portál zátěžovým testům a také pokusům o porušení integrity dat. Odhalte zranitelná místa a navrhněte opravu.
- Navrhněte ergonomické uživatelské rozhraní. Zjistěte chování a požadavky uživatelů. Navrhněte GUI tak, aby bylo intuitivní a rychle dovedlo uživatele k cíli (nalezení informace).
- Implementujte Prednasky.com jako Flash plugin. Implementujte maximum z portálu do Flash pluginu, který by se dal umístit na jakoukoli stránku.
- Implementujte Prednasky.com jako HTML5 plugin. Implementujte maximum z portálu do HTML5 pluginu, který by se dal umístit na jakoukoli stránku.
Abyste si nemysleli, že vaše spolupráce s námi je výhodná jen pro nás, tady je několik výhod pro vás:
- Budete dělat to, co vás baví a co má smysl.
- Budete na svou práci hrdí, pomáháte vám i vašim kolegům.
- Můžete svou práci testovat na reálných datech a v reálném prostředí.
- Můžete dostat zpětnou vazbu od uživatelů a odladit chyby.
- Můžete pracovat v týmu.
Seznam zadání zcela určitě není konečný a fixní. Jde spíš o návrh. Máte vlastní nápad? Přijďte za mnou. Těším se.
Igi.
Žádné komentáře:
Okomentovat