TIP#2344: Přepis (podcastu) s pomocí Whisper? Ukážeme si na příkladu důležitého tématu a zjistíte, jak na Whisper na Macu, Windows a v Google Colab

Na konci prosince se #TYDEN k poslouchání věnoval důležitému tématu. Podcast Zapamatujte si: Když něco (na Internetu) prodáváte, kupující platí vám. Ne vy jemu! má patnáct minut. A protože se čerstvě objevila aplikace MacWhisper, tak jsem si koupil plnou verzi a nechal MacBook asi 2.5 hodin těch patnáct minut “přepsat.  Takto dlouho proto, že je to “jen” MacBook Air, takže nemá slušnou GPU ani nijak mimořádně výkonný procesor. A také proto, že rychlejší přepis dává dost šílené výsledky. Ten pomalejší, s detailnějším a rozsáhlejším “slovníkem” sice není bezchybný, ale česky umí vlastně překvapivě dobře. Posuďte sami na konci tipu. Nezasahoval jsem do výsledku, jen jsem jeden extrémně dlouhý text “rozsekal” do odstavců věty Whisper pozná docela dobře, ale “odstavce” jasně že ne. Co že je to ten Whisper? A jak ho využít? Whisper je další AI od OpenAI. Na množství vzorků naučili AI rozpoznávat mluvenou řeč a získat textový přepis. Na rozdíl od různých jiných řešení umí češtinu. Má různé rozsahy “naučených” dat v základní podobě u češtiny dost chybuje, ale je to poměrně rychle. V plné podobě chybuje nesrovnatelně méně, ale vyžaduje hodně výkonu. Pokud máte Mac, tak můžete zkusit MacWhisper. Ale jak už bylo naznačeno výše, chce to Mac s M1/M2 a hlavně, se slušenou GPU.  Užitečné informace k Whisperu najdete na GitHubu a odtamtud případně vede i cesta k využití “přímo” na jiných platformách stačí zvládat Python, mít PyTorch a nějaké další drobnosti. A ideálně mít GPU s podporou CUDA, jinak to bude pomalé (protože CPU)  TIP: Velký přehled praktických #AI pomůcek (text, video, zvuk, obrázky, programování, vyhledávání, překlady, sociální sítě) je velmi užitečný a hodně obsáhlý Přímo od OpenAI si můžete přečíst Introducing Whisper a pochopitelně také najít vše, opět, na Githubu. Hodně zajímavých je několik Google Colab notebooků, třeba Transcribe and Translate with OpenAI Whisper, kde si můžete zkusit Whisper ve virtuálním stroji. Jde tam nahrát i výše uvedený podcast (15 minut audio) a je to, nutno dodat, rychlejší, než to pouštět na mém MacBooku s modelem large to trvalo 13 minut, oproti hodinám na notebooku. Další povídání k využít Colab viz How to Run OpenAI Whisper in Google Colab či How to run Whisper on Google Colaboratory TIP: Pokud byste u výše uvedeného Colab tápali, tak Martin Jurica k tomu v češtině sepsal postup. Whisper jde mít i v Linuxu či Windows Osobně jsem to zkoušel zprovoznit právě ve Windows, ale nechtělo se tomu budete-li zkoušet, pořiďte si Python 3.9.9. Novější zlobí. Chcete-li zkoušet, tak viz How to Run OpenAI’s Whisper Speech Recognition Model Pokud se vám ve WIndows zadaří, tak pozor PyTorch co dorazí s Pythonem je CPU podoba, potřebujete CUDA verzi: pip uninstall torchpip cache purgepip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116 A pak už můžete použít následující příkaz pro spuštění přepisu (audio.wav nahradíte jménem vlastního souboru, wav. mp4, atd). whisper "audio.wav" --model medium model má řadu možností, rozumný je právě medium, ale můžete zkoušet i další při prvním užití se bude stahovat (large, ten nejdetailnější má skoro 3 GB). A čím detailnější, tím pomalejší bude přepis. A také pozor na to, že největší model se vám nemusí vměstnat do GPU Pokud nevíte co Whisper použije/používá, tak to zjistíte přes whisper --help | findstr -i pytorch U GPU ještě můžete narazit na to, že je třeba aby podporovala CUDA 3.7 jako minimum. Máte-li NVIDIA a nevíte, tak zkuste následující příkaz nvidia-smi.exe Může případně pomoci stáhnout i CUDA Toolkit 11.7 Downloads | NVIDIA Developer (může být nutné zvolit odpovídající verzi). Jazyk Whisper zkouší detekovat, ale můžete tomu pomoci s language czech přeskočit. Ušetříte zlomek času, ale také to může vyřešit problém špatné detekce.  Setkáte-li se s protestem o chybějícím ffmpeg, tak si ho nainstalujte. Co se Linuxu týče, tak je to vlastně totožné výše popsané týkající se Pythonu tam funguje stejně, Whisper a jeho parametry také. Tedy například sudo install ffmpegpip install git+https://github.com/openai/whisper.git Google Colab Jak už bylo zmíněno výše je možné využít Google Colab potřebujete jen nějaký účet u Google (Gmail, GWS) a udělejte si kopii Transcribe and Translate with OpenAI Whisper (Soubor -> Uložit kopii na disk). Pak tam nahrajte do souborů vaše audio a postupně spouštějte Krok 1, Krok 2, Krok 3 (což je zmíněné nahrání souboru). V Kroku 4 si ručně přepíšete jméno souboru na to vaše a medium můžete přehodit na large. A spustíte ….  Výsledek můžete sledovat průběžně a po dokončení bude uložený jako textový soubor (a navíc i JSON, SRT, TSV a VTT máte tedy přímou podporu pro titulkování). Takže vám nic nebrání si potřebné stáhnout. Pokud chcete, tak navíc v kroku 5 je možné překládat tj. můžete na vstupu pustit dovnitř angličtinu (audio), získat její přepis a přeložit do češtiny. Jen pozor, je to samostatný krok místo kroku 4, ne pokračování čtvrtého.  TIP: Výstupy v podobě titulků (SRT a další) v kombinaci s překladem mohou znamenat, že si můžete vzít video co není česky a získat tak české titulky. Stejně tak třeba anglické k českému videu. Výhoda Google Colab je, že to nepoběží nikde u vás a můžete to spouštět odkudkoliv (protože prostředí je prohlížeč). Hardware navíc je dostatečně rychlé i silné tedy i pro large model. Nepočítejte ale s tím, že by to bylo nějak “instantní”, ale jak už bylo řečeno, 15 minut audio a nejnáročnější model trval 13 minut. - A teď už ten slíbený přepis pro představu (medium). Zapamatujte si: Když něco (na Internetu) prodáváte, kupující platí vám. Ne vy jemu! 29. prosince, 18. týden poslouchání. Včera, až jsem na 365 typech vydal tip s názvem Jak nenaletět podvodníkům, když něco prodáváte přes internet a co nikdy nedělat? A protože je to natolik důležité a tak velká je to epidemie, tak to zkusím ještě polopatisticky vysvětlit právě v podcastu. A budu taky doufat, že se to nahraje normálně a ne nějak přebuzeně jako minule, za což se jak jinak omlouvám. Týden k poslouchání je podcast. Spravidla vychází ve čtvrtek, k nalezení je na Spotify, Apple, Google, na Substacku, zejména tedy tam, na rychlovky.substack.com. Je vždy to povídání doplněno dávkou užitečných odkazů pro studování. Takže chcete-li pomoci, zejména v tomto případě, tak sdílejte tento podcast třeba z rychlovek, nebo odkuďkoliv jinak, nebo sdílejte i jednoduchou infografiku, která právě na rychlovky.substec.com je přiložená, ale můžete samozřejmě i sdílet tamtež uvedený delší tip na 365 typech. A tradičně, pojďme na to. Pojďme na to. První věc, kterou si zapamatojte, když něco na internetu prodáváte, tak jste to vy, kdo určuje podmínky. Ne ten, kdo je kupující. Ten, komu to prodáváte. Tou první věcí, kterou určujete vy, je, že vy odesíláte, nebo předáváte s boží službou, nebo způsobem vašeho výběru. Ten, kdo vás bude chtít okrást, a o tom tady dneska mluvíme, Vás totiž bude chtít uvrtat do toho, že si pro zboží pošle nějakou službu. DPD, Českou poštu, PPL, těžko říct co. A bude tvrdit, že ta služba, kterou on vlastně objedná, si to zboží vyzvedne a že ručí za dodání peněz. a těžko říct vůbec, co ještě všechno vám se tam bude snažit klout z doholavy. Ne! Vy jste ten, kdo zboží odesílá, vybere si k tomu službu, klidně některou z těch jmenovaných, nebo třeba zásilkovnu, nebo cokoliv dalšího, a nenecháte si do toho mluvit, jakým způsobem zboží odeslat. Můžete přistoupit na osobní odběr V takovém případě ten kupující se může dostavit na místo, na kterém se dohodnete. Tradičně z hlediska bezpečnosti tam platí, že byste tam rozhodně neměli být sami, že byste si ho rozhodně neměli pouštět do bytu a tak podobně. Ale pořád to musíte být vy, kdo to řídí, kdo určuje, jakým způsobem se to zboží, dodá. Bez pardonu, bez diskuze, pokud někdo po vás chce něco jiného, tak se s ním o tom vůbec nebavte. Ta daleko důležitější věc ale je, a je vlastně podtitulu tohoto dnešního podcastu, vy prodáváte, takže ten, kdo kupuje, platí vám. V žádném případě vy nikdy neplatíte jemu. Většina těch podvodů, které fungují tak, že vy něco pověsíte na internet, že to chcete prodat na Facebook Marketplace, na nějaké bazary, nebo na cokoliv dalšího, tak se vám prakticky během okamžiku někdo třeba přes WhatsApp, přes Messenger, nebo e-mailem SMS-kou ozve, jestli to zboží ještě dostupné a že ho chce koupit. a že si proto sboží pošle kurýrní službu a že vám zaplatí a že ta kurýrní služba ručí za to, že dostanete peníze a v zápětí na to vám pošle důkaz o tom, úvozovká důkaz, že už ty peníze zaplatil a když na to kliknete, tak to bude vypadat jako když jsou to stránky té kurýrní služby, o které on vám řekl. Podotýkám, že to je nejčastější způsob, ještě mnoho jiných. A tam bude napsáno, co od vás kupuje, kolik paněsto stojí a svět teď jiv se, vy tam budete muset vyplnit údaje platební karty, abyste přijali platbu. To je samozřejmě nesmysl. Nebo vám bude tvrdit, že vám ty peníze posílá na bankovní kartu a proto potřebuje od vás údaje o platební kartě. To je samozřejmě taky další úplně absurdní nesmysl. na bankovní kartu, platební kartu, vám nemůže nikdo nic poslat. A tu vám maximálně můžou vrátit nějaké platby, které se vrací zpět, ale přímo na tu kartu vám nikdo nic poslat nemůže. Takže, abych to zopakoval, to zásadní je, že vy prodáváte a ten kupující platí vám, to znamená, pošle vám peníze na účet, to je celkem snadná záležitost, může vám je poslat na váš Paypal nebo na něco takového, ale pořád je to ten, kdo platí vám. Vy mu můžete poslat o sboží na dobírku, ale opět, jako už bylo řečeno před chvílí, vy si vyberete tu službu, která tu dobírku realizuje a on ty peníze předá té službě proti předání sboží. Nebo samozřejmě u osobního odběru přijde k vám domů nebo někam, kde se domluvíte a tam vám ty peníze předá v hotovosti. Nebudete akceptovat žádné Skrimšoty toho, že on už zaplatil, nebo webby, kam se musíte nějakým způsobem přihlásit pomocí bankovní karty, platevní karty, nebo dokonce přihlašovacích údajů k vašemu e-mailovému účtu, i to se dokonce děje. Popravdě řečeno, třetí pravidlo je, že nebudete klikat na žádné odkazy, které vám ten kupující posílá, To, že jediné, na co by někdo měl klikat, je on, že se podívá na nějaký ten váš inzerátor. Vy k tomu nepotřebujete nic. Nepotřebujete k tomu ani žádnou mobilní aplikaci, nepotřebujete k tomu žádný software do počítače, aby se to boží, nebo ta služba, nebo něco prodalo, abyste dostali své peníze. Jeden z těch okrajovějších a méně čestých způsobů bývá to, a o tom byla řeč v jednom z dřívějších podcastů na týdnu že vás přesvědčí, abyste si do počítače nainstalovali software pro vzdálený přístup zápětí na to pomocí toho softwareu pro vzdálený přístup ovládne váš počítač dostane se do vašeho bankovnictví a tam vás okamžitě připraví o peníze to znamená, na nic neklikejte, nic si neinstalojte že ten prdávající musí platit vám. Oni budou mít spoustu záhadných výmluv, co všechno je potřeba udělat a jak všechno už zajistili a jak všechno už zaplatili. A v těch nejpokročilejších, nejnáročnějších případech tam dokonce ještě budou na vás hrát takovou habadňuru, že to sboží už odešlo, ale že se objevily komplikace na celnici, že se objevily komplikace u dopravce, zaplatit nějaké peníze za dclo, peníze za dopravu. A opět vám k tomu poskytnou nějaký odkaz na stránky, které vypadají třeba jako stránky České pošty o placení dcla. A tam po vás bude ta falešná Česká pošta nebo někdo jiný, to je úplně jedno, kdo chtíta, abyste zaplatili za něco, co vlastně má někdo platit vám. Pokud je s tím zbožím spojené nějaké poštovné nebo nějaké další náklady, tak samozřejmě tyto částky si přičítejte k ceně toho zboží a okamžitě hned na začátku dejte jasně najevu, že je musí zaplatit ten kupující, to znamená on vám musí poslat, jakož bylo řečeno, na účet nebo nějakou jinou bezpečnou formou, nebo na dobírky, ty peníze, na kterých se dohodnete, včetně těchto dodatečných nákladů, v plné výši, A vy mu pošlete zboží a štepré poté, co ty peníze budete mít skutečně na vašem účtu. A ne nenaletíte na to, že on vám poslal screenshot, že peníze odeslal, nebo vám pošle odkaz, kde je napsáno, že peníze odešly. To, že peníze máte, musíte vědět vy tak, že se podíváte do svého bankovnictví, na výpis z vašeho bankovnictví, a tam ty peníze najdete. v té správné rýši, pochopitelně. Dejte si pozor i na to, abyste takovýmto podvodníkům nedávali své osobní doklady. Nepotřebují váš občanský průkaz, nepotřebují žádný jiný osobní doklad k tomu, aby třeba kurierní služba vám doručila zboží. Tohle to tam vůbec není potřeba. Nevěřte ani tomu, že vám pošlou nějaké QR kódy, které slouží k tomu, že se ověří, že oni vám zaplatili, nebo že vy aktivujete tu dodávku z boží uklidní služby, nebo že ji vůbec přijmete, aby se mohlo začít dojít k tomu doručování. Ty metody jsou velmi sofistikované, ale opravdu velmi, velmi, velmi. A není až tak těžké se tomuto mluv vyhnout, když si vzpomenete na to jedno nejzásadnější pravidlo v názvu tohoto podcastu. Když něco na internetu prodáváte, kupující platí Vám, ne vy jemu. Klidně si to zopakujte desetkrát, povězte si to na žlutý papírek nad monitor a vždycky se na to podívejte v okamžiku, kdy vám nějaký podpolvník na internetu napíše Dobrý den, omlouvám se, že vás obtěžuji, jmenuji se Vymyšlené jméno, můžete mi říct, jestli je to ještě na prdej a v zápětí na to vám napíše zaplaceno, následujte odkaz a získejte peníze. Což samozřejmě je přesně ta cesta, jak vás okradou. Jakmile jim dáte údaje platební karty a není ani nutné jim dávat ten bezpečností kód na zadní straně, tak tu kartu použijí k tomu, aby z ní získali peníze. Dobře, co s tím dělat? Ignorovat. Blokujte je. Můžete je nahlašovat Facebooku nebo někomu dalšímu, ale zajímavé na u Facebooku zjistíte, že je to úplně jedno a Facebooku vůbec nic neřeší. Nemá absolutně zájem, nemá lidi, nechce na to vynakládat nic. Pokud to bude na nějaké české službě, na nějakém českém bazaru, tam by bylo velmi dobré a nahlašovat tam upravozovateli, protože tam přece jenom ten přístup bývá zodpovědnější. Ale jakmile je to na některé z těch sociálních cítí, Whatsapp, Facebook, cokoliv dalšího, zejména zahraničních, tak si buďte jistí, že ta sociální cít s tím nic dělat nebude. Takže tyhle podvodníky zablokovat, pokud s nimi komunikujete přes SMS, tak je normálně zablokujete v mobilním telefonu jako volajícího, protože nemá vůbec smysl s tím, cokoliv řeší dál. Oni navíc můj být velmi nehodbitní. Co se stane, když naletíte? To je těžká záležitost. Tohle je organizovaný zločin, který už několik let jede. Jsou to klidně i desítky lidí v nějakém call centeru v úvozovkách, kde mají k dispozici spoustu softwaru a všechny možné věci, generují ty falečné weby, mají ukradené domény, ukradené identity, mění telefonní čísla, na sociálních sítích vystupují pod desítkami jmén a zároveň jak komunikují s vámi, tak komunikují třeba s desítkami nebo stovkami dalších lidí. Část toho je samozřejmě naskriptovaná, protože je to call centrum, část toho potom už je komunikace s nějakým živým člověkem. Prakticky vždycky jsou někde ze zahraničí. Možná nějakých pár případů z té stovky, s kterými byste se setkali, budou někde tady v Česku. Což znamená, že pokud tohle to nahlásíte na policii České republiky, ale podotýkám, že byste to určitě udělat měli, tak je velmi malá pravděpodobnost, že je někdy dopadnou. Nebo je dopadnou za velmi, velmi dlouho, protože budou strašně dlouho sledovat, rozkrývat, mapovat a pak na ně po nich půjdou. Ale nečekejte, že pokud jste přišli o peníze, že vám tohle peníze nějak snadno vrátí zpátky. Máte určitou šanci tohleto zkusit s bankou, reklamovat tu platbu, pokusit se jí získat zpátky, ale může se vám stát, že vám řeknou, že prostě jste si to způsobili sami a proč by tedy oni se měli něčím takovým zabývat. Logická záležitost. Každopádně ale, nahlašujte tohleto na policii České republiky, předávejte jim veškeré informace, pokuste se co nejrychleji si udělat kopii té komunikace, kterou jste s tím zlodějem v tom Whatsappu nebo v něčem měli, stačí štířit screenshoty, aby tam bylo vidět úplně všechno, protože samozřejmě on může udělat to, ten zloděj, že to potom velmi rychle smaže v okamžiku, kdy vlastně dosáhne svého a vy přijdete o peníze. Nejlepší, co v tomto případě můžete dělat, a měli byste dělat je, že budete pamatovat na to, že když něco na internetu prodáváte, tak kupující platí vám. Nikdy neplatíte vy jemu. Nepředáváte mu údaje platební karty, nepředáváte mu přihlašovací údaje do bankovnictví, nepředáváte mu přihlašovací údaje k vašemu počítači, neklikáte na žádné podvodné stránky, které se vydávají za banku, přepravní službu nebo cokoliv dalšího. Vy si diktujete, čím posíláte, vy říkáte, jakým způsobem za to ten člověk platí a vy jste ten, kdo má celou tuhletu situaci pod kontrolou. Takže díky! Poslouchali jste 18. týden poslouchání. Připomenu, že chcete-li pomoci, tak ho sdílejte. najdete ho na rychloflky.substack.com a naslyšenou v novém roce 2023 a díky, že posloucháte. konec přepisu A třešnička nakonec. Srovnání (diff) mezi medium a large. Další tipy týkající se podcastůThe post TIP#2344: Přepis (podcastu) s pomocí Whisper? Ukážeme si na příkladu důležitého tématu a zjistíte, jak na Whisper na Macu, Windows a v Google Colab first appeared on @365tipu.

projít na článek

Klávesové zkratky, které usnadní práci na Macu (nejen) uživatelům Chromu

Operační systém macOS nabízí podporu velmi pestré palety klávesových zkratek, které vám mohou pomoci například při práci s textem, brouzdání internetem v Safari nebo při spouštění multimediálních souborů. Dnes si představíme hned několik užitečných kláves

projít na článek

Jak si ve Windows správně nastavit zobrazení na dva monitory

Pokud pracujete s více aplikacemi současně, mohla by se vám hodit větší pracovní plocha. Získáte ji díky dvěma monitorům. Ukážeme, jak si je správně nastavit ve Windows.

projít na článek

Windows 10 za pouhých 6,12 € a Office 2021 za 13,05 €

Pokud stále používáte Windows 7 nebo 8, můžete na Windows 10 přejít zdarma. Pokud však potřebujete nainstalovat operační systém Windows do nového počítače, pohodlnějším způsobem je přeinstalovat Windows 10 nebo Windows 11. Cena systému Windows 10 Pro na o

projít na článek

Zajímá vás cena Windows 7? Známe ceny!

Zajímá vás, za kolik se bude prodávat nejnovější operační systém Microsoftu? Windows 7 Starter Edition 199,95 $ (dolarů) > 4400,- Kč Windows 7 Home Premium 25

projít na článek

Nintendo Switch na Macu, Swappie, Apple Car

Jak si můžete zahrát hry z Nintenda Switch na Macu. Vyzkoušeli jsme repasovaný iPhone ze Swappie. Apple Car bude. I. část – Úvod a komentáře posluchačů (0:00) II. část – Hry z Nintenda Switch na Macu (14:07) III. část – Tip na příslušenství (46:46) IV. čá

projít na článek