Breuddwyd Macsen

macs Image copyright Canolfan Bedwyr
Image caption Ydy dyfodol y Gymraeg yn dibynnu ar y teclyn hwn?

Alexa, Cortana a Siri. Mae'n siŵr y bydd nifer ohonoch chi'n gyfarwydd â thechnoleg llais Amazon, Microsoft ac Apple.

Ond mae pryderon wedi codi am effaith y datblygiadau ar yr iaith Gymraeg.

Mae llawer yn pryderu am effaith dechrau gorfod siarad Saesneg gyda'ch teclyn cyfrifiadurol. Ond mae arbenigwyr iaith wedi rhagweld hyn ac wedi gwneud gwaith ymchwil yn y maes.

Yng Nghanolfan Bedwyr, Prifysgol Bangor mae llawer o'r gwaith hwn wedi bod yn cael ei gynnal.

Delyth Prys yw Pennaeth yr Uned Technolegau Iaith:


Bron i dair blynedd yn ôl, gwnaethon ni lansio ap Paldaruo, lle wnaethon ni ofyn i'r cyhoedd gyfrannu eu lleisiau er mwyn ceisio adeiladu cronfa ddata o wahanol oedran, acenion, geiriau, a threigliadau...

Mae'r ap dal ar gael ac mae'n dal i gasglu data. Erbyn hyn mae dros 600 o bobl wedi cyfrannu degau o oriau o recordiadau sain.

Rydyn ni wedi llwyddo i greu meddalwedd syml o'r enw Macsen sydd yn gallu rhedeg ar gyfrifiadur bach rhad y Raspberry Pi, i allu adnabod ac ateb cwestiynau elfennol fel gofyn beth yw'r newyddion neu faint o'r gloch yw hi.

Image copyright Canolfan Bedwyr

Ewyllys da

Un fantais sydd gennym ni yma yng Nghymru yw bod gyda ni lot o ewyllys da, ond yn anffodus, mi ydyn ni'n dal yn brin iawn o adnoddau.

Mae'r dechnoleg sy'n sail i ddarparu adnabod lleferydd wedi newid yn sylweddol yn ddiweddar. Erbyn hyn mae 'na ragor o ddefnydd o feddalwedd rhwydweithiau niwral artiffisial.

Yn fras, mae rhwydweithiau niwral yn gweithio yn debycach i'r ymennydd dynol, gyda chysylltiadau yn cael eu creu a'u haddasu rhwng niwronau artiffisial yn ystod y broses hyfforddi. Mae'r dull yn rhoi canlyniadau gymaint gwell ond mae angen casgliadau enfawr o ddata yn ogystal â lot o bŵer cyfrifiadurol.

I fedru adnabod lleferydd unrhyw beth i'r un graddau â'r hyn sydd ar gael yn Saesneg byddai angen degau o filoedd o oriau o recordiadau sain.

Mae'r meddalwedd ar gyfer defnyddio rhwydweithiau niwral artiffisial ar gael i ni, drwy garedigrwydd ambell i Brifysgol a chwmni masnachol, ac mae datblygwyr yn yr Uned ac ymchwilwyr yn Ysgol Ieithyddiaeth Prifysgol Bangor wedi dechrau eu defnyddio i geisio deall unrhyw welliannau ar sail adnoddau presennol.

Yn y cyfamser, dydy'r cwmnïau mawr ddim yn mynd i flaenoriaethu'r Gymraeg oherwydd cwmnïau masnachol ydyn nhw i gyd.

Yr unig ffordd y bydd hi'n bosibl i siaradwyr Cymraeg siarad eu hiaith i'w dyfeisiadau a'u cyfrifiaduron yw i'r gymuned meddalwedd Cymraeg ddatblygu a defnyddio datrysiadau eu hunain, ac wedyn ysgogi'r cwmnïau mawr i ehangu a gwella eu darpariaeth drwy rannu ein gwaith ni yn hael, ac mewn cod agored.

Wrth gwrs, mewn byd perffaith byddai'r cwmnïau yn cydweithio gyda'r gymuned meddalwedd Cymraeg ac yn cynnig cyfrannu eu pŵer cyfrifiadurol neu tuag at gostau. Ond go brin y bydd hyn yn digwydd gan fod cannoedd a miloedd o ieithoedd eraill angen yr un cymorth.

Mae'r gwaith wedi dechrau ac yn datblygu'n ddyddiol ac mae cyfleoedd i ni ddilyn y dulliau newydd er mwyn gallu cynnig canlyniadau a darpariaeth well ar gyfer y Gymraeg. Ond mae cyllid prosiect Macsen yn dod i ben cyn bo hir.

Os gallwn ni sicrhau rhagor o gyllid tymor hir a denu rhagor o gyfranwyr i'n helpu i ehangu'r gronfa ddata, fe allai'r sefyllfa newid. Wedi'r cyfan, dyw'r gwaith ddim tu hwnt i'n gallu.

Image copyright Canolfan Bedwyr

Cysylltiadau Rhyngrwyd

Dyw'r BBC ddim yn gyfrifol am safleoedd rhyngrwyd allanol.