+2 تراز
1,443 بازدید
در زبانشناسی از سوی
درود
من دانش آموخته رشته های برق (EE) و دانش رایانه (CS) در آمریکا هستم. در دنباله پژوهش های پیشین، دلبستگی فراوانی به زنده کردن زبان پهلوی (و در پایان، پالایش همه زبانهای ایرانی نو مانند فارسی، کردی، بلوچی، ... از وام واژه های بیگانه) پیدا کرده ام. برای این کار ترگمان نوشته های انگلیسی (به ویژه در زمینه های فن آوری، دانش، و هندازگری) به زبان پهلوی با بهره گرفتن از نرم افزارهای رایانه ای، می‌تواند بسیار سودمند باشد. برای نمونه، بابه کار بردن نرم افزاری که نشانی آنرا در زیر آورده‌ام، توانستم دفتر های یکم و دوم از نسک تاریخ شهرنشینی، نوشته  Will Durant را (میانگین در ۱۴تسوک برای هر دفتر) از انگلیسی به پهلوی برگردان کنم. (هرچند این ترگمان به ویرایش نیاز دارد، ولی به کار بردن نرم افزار، همچنان کمک بزرگی خواهد بود)
برای پیشرفت فرهنگ واژگان این نرم افزار، و دگرگونی آن به فرهنگ واژگان ایرانی نو، از همه ایرانیانی که دلبسته پاسداری از زبانهای ایرانی هستند، درخواست کمک دارم. نشانی این نرم افزار رایانه ای https://github.com/judahjohnson/parsig است، و همگان می‌توانند آزادانه از آن بهره برداریکنند. پرونده README.md، همه کاستی ها را به گستردگی روشن می‌ کند. برای نمونه، نیاز به افزودن واژگانی که در فرهنگ کنونی پهلوی نیستند، همچون واژه transistor در فرهنگ واژگان electronic. کاستی های دیگری هم در این برنامه هستند، مانند واژگانی که بیش از یک چم دارند، همانند واژهpound که هم در چم یکای اندازه گیری سنگینیست، و هم در چم کوفتن، ولی در این برنامه من تنها یک چم را به کار برده ام، چون درست کردن فرهنگ واژگانی که همه چم ها را در بر گیرد زمان فراوانی میبرد و من یک تنه نمیتوانستم آن را انجام دهم (خواهشمندم برای آگاهی از دیگر کاستی های اینبرنامه، پرونده README.md به نشانی بالا را ببینید).


یاران گرامی که می خواهند در این برنامه همکاری کنند، نیازی ندارند که زبانپهلوی بدانند. نخست، بسیاری از واژه های فارسی و پهلوی همانند هستند. دوم، فرهنگ واژگان این برنامه به کمک برنامههای یارانه ای و پردازش (روش‌هایی مانند  parsing, scraping, tokenizing) فرهنگ واژگان پهلوی به نشانیhttp://www.parsig.org/dictionary.html ساخته شده است، ولی از آنجا که این برنامه های رایانه ای در هنگامپردازش نوشتار، می‌توانند لغزش های پیش بینی نشده (bug) داشته باشند، بنا بر این، فرهنگ واژگانی که از این راهساخته می شود، باز نیازمند ویرایش است. این ویرایش به سادگی می‌تواند از راه کنار هم گذاشتن فرهنگ واژگان اینبرنامه، و دیگر فرهنگ واژگان پهلوی مانند فرهنگ انگلیسی-پهلوی به نشانی http://www.parsig.org/dictionary.html،فرهنگ فارسی-پهلوی استاد فره وشی، یا فرهنگ پهلوی-انگلیسی MacKenzie انجام شود و بنابر این نیازی به دانستنپهلوی نیست. سوم، دیگر واژگان ایرانی مانند فارسی، کردی، بلوچی، ایرونستانی، ... که از وام واژه های بیگانه پالایششده‌اند، به آسانی می‌توانند به این فرهنگ افزوده شوند، و نیازی به دانستن زبان پهلوی نیست و برای این کار تنها آشنایی با زبان انگلیسی بسنده است.

4 پاسخ

+1 تراز
از سوی

درود 

سپاس بیکران از فرهیخته و شیفته زبان ناب پارسی که پالایش و توان افزایی زبانی را در کار گروهی و هم افزایی می داند و همگان را به این شیوه گرانسنگ فرا می خواند ، امید که بتوانیم به یاری یکدیگر در استوار و پایای زبان دیرپایی پارسی بیش از پیش بکوشیم .
0 تراز
از سوی (4,357 تراز)

آیا از خود پرسیده اید این زوان پهلویک نو را همه میپسندند و با شیوه ی باززیوانش آن همداستان اند یا نه؟

0
از سوی (2,031 تراز)
ویراست در از سوی

درود بر شما،

من چند سالی در زمینه پردازش زبانهای گفتاری (Natural Language Processing) با رایانه در دانشگاه کار کردم، ولی یکی از انگیزه های بنیادین من برای انجام این کار، دیدن نوشتارهایی در زمینه های هندازگری و دانش، به زبان لاتین در Wikipedia بود. برای نمونه نگاه کنید به این نوشتار

https://la.m.wikipedia.org/wiki/Transistrum

واژگان transistor, emitter, collector, base همه در فرهنگ واژگان electronic به زبان انگلیسی هستند. transistor ها در سده ۲۰ ام در آمریکا ساخته شده اند، بنابراین همه این واژه ها ۱۰۰ سال نیست که به فرهنگ واژگان electronic در انگلیسی راه یافته اند، ولی همانگونه که در این نوشتار میبینیم، برای تک تک این واژگان به زبان لاتین واژه ساخته شده است، (transistrum -> transistor, basem-> base, emittrum -> emitter, collectrum -> collector) هرچند بسیاری از واژگان انگلیسی از لاتین گرفته شده اند و بنابر این، این کارنباید چندان کار سختی بوده باشد، ولی اگر به واژگانی که امروزه در ایران به کار میبریم نگاهی بیندازیم، در می یابیم که تلاش‌هایی که در این زمینه درایران انجام شده، در سنجش با دیگر زبان ها به سرانجامی نرسیده است. برای نمونه در نسکها و دانشگاه‌های ایران، امروزه این واژگان را ترانزیستور،بیس، امیتر، و کولکتور مینویسند و می‌خوانند. بنا براین، در سده ۲۱ ام، ما نمیتوانیم تنها به چند نسک بر جای مانده به زبان پهلوی و اوستایی (که بسیاری، همان ها را هم نخوانده اند) بسنده کنیم. من بر آن شدم که یک Wikipedia به زبان پهلوی بسازم و تا آنجا که می‌توانم، نوشتارهایی در زمینه هندازگری و دانش را به پهلوی برگردانم، تا اینکار انگیزه ای باشد برای ساختن و به کار بردن واژگان نو در این زمینه ها. نوشتارها در Wikipedia ازبازدید خوبی از کشورهای گوناگون برخوردارند و پیوندها به Wikipedia همواره از نخستین پیوندهایی هستند که در سرانجام جستجو در google, yahoo, bing نمایش داده  می شوند. بازدید فراوان همچنین می‌تواند در پالایش زبانهای ایرانی امروزین مانند فارسی، بلوچی، کردی و... از وام واژه ها ی بیگانه سودمند باشد. افزون بر این، همه می‌توانند دبیره ها یی مانند UN 2012 یا IPA را بخوانند ( https://en.m.wikipedia.org/wiki/Romanization_of_Persian  را ببینید) مانند ایرانیان اوستیا، چچن، ترکیه، تاجیکستان، گرجستان، ازبکستان،قرقیزستان، ارمنستان، هندوستان، و ....، همچنین ایرانیانی که در اروپا و آمریکا زاده می‌شوند و می‌توانند به یک یا چند زبان ایرانی گفتگو کنند، ولی نمیتوانند دبیره کنونی ایران را بخوانند. شوربختانه Wikipedia پروانه نوشتن به زبانهای کهن را نمیدهد (هر چند برای نمونه، بخش لاتین در آن هست وکاربران فراوانی هم دارد). برای دیدن درخواست هایی که برای زبان های ایرانی به سرانجام نرسیده اند ۲ نمونه زیر را ببینید:

https://meta.m.wikimedia.org/wiki/Requests_for_new_languages/Wikipedia_Pahlavi

https://meta.m.wikimedia.org/wiki/Requests_for_new_languages/Wikipedia_Old_Persian

تا آنجا که من در یافتم، گردانندگان Wikipedia میخواهند استیگان باشند که همیشه کاربرانی هستند که نوشتارهای پیشین را ویرایش می کنند، و یانوشتارهای نو پدید می آورند. بنابراین اگر چند کاربر درخواست بدهند، شدنی است که گردانندگان، سرانجام درخواست را بپذیرند. کمتر از ۱۰ سال پیش من در آمریکا ‌دانشجو بودم، و می دیدم که دانشجویانی که در رشته های هندازگری آموزش می دیدند، به آموزگاه لاتین میرفتند (میتوانستند بین چند زبان یکی را بر گزینند، که درآن میان، یکی از زبان ها لاتین بود). آنگاه از خودم پرسیدم براستی چه شماری از دانشجویان ایرانی میدانند که زبانی هم به نام زبان پهلوی هست؟

این کار تنها کرانمند به واژگان فناوری یا پزشکی نیست. برای نمونه، واژگانی که در یک گزارش ورزشی ساده برای مردم همگانی از تلویزیون یا رادیو پخش می‌شوند یادر روزنامه ها نوشته می‌شوند مانند کرنر، پنالتی، دریبل، هند، فل، خطا، حمله، دفاع، رانینگ، کارت، فوتبال، آف ساید، ضربه، بسکتبال، بیسبال، بوکس،اسکی و ... و یا واژگانی که در یک دستور آشپزی ساده هستند مانند غذا، میکسر، مایکروویو، میکس کردن، مخلوط کردن، اضافه کردن، ادویه، مش (mash) کردن، مشر (masher)، مخمر، پاستا و ... که همه این واژه ها را هر کدام از ما ایرانیان می‌توانیم دست کم در Wikipedia به سادگی به زبان ایرانی برگردان کنیم. 

به امید سربلندی همه ایرانیان

0
از سوی (4,357 تراز)

اندرباره ی شیوه ی واژه‌گزینی و واژه‌سازی میخواهم بیشتر دانستن و این که وامگیری برای "مفهومان" نو بیشتر از کدام زوانان و چگونه است؟

دیگر این که شیوه ی آوانویسی مکنزی را بوندکانه نمیپسندم.  
0
از سوی (2,031 تراز)
ویراست در از سوی

درود،


چون اکنون برابری برای بسیاری از واژه های نو مانند واژه transistor نداریم، من یک ویژگی به این نرم افزار افزودم، و آن اینکه می توانید با نگرش به هر ارت، پهرستی از واژگان نو را جداگانه برای آن ارت به زبان انگلیگ بسازید و واژگانی که در آن پهرست هستند به پهلویگ وستی نمیشوند. نمونه وار، بیانگارید که بخواهید یک نوشته با ارت electronic ، و یک نوشته با ارت گیتاشناسی وستی کنید، ودر نوشته electronic ، واژه current به چم electrical current دارید. این واژه در واژه نامه electronic است، و در سانیز های رایگری در نسک های هندازگری، با کوتاه نویسی C یا I نمایش داده می‌شود  (در نسک های کنونی جریان الکتریکی وستی می‌کنند) و در نوشته گیتاشناسی هم واژه current به چم روان بودن آب یک رود یا چشمه، (در نسک های کنونی جریان آب، یا جاری بودن آب وستی می‌کنند). در واژه نامه پهلوی اکنونیگ که من ‌دارم، تنها یک چم برای واژه current هست (ravāg) .اکنون میتوانید برای ارت electronic یک پرونده با پسوند xlsx بسازید و در آن واژه current را بنویسید و برای نوشته گیتاشناسی هم یک پرونده جداگانه بسازید که واژه current در آن نباشد. زمانی که برنامه را میرانید، واژه current در نوشته electronic به پهلوی وستی نمی‌شود و همان current دوباره در وستی پهلوی نمایانده می‌شود، ولی در وستی پهلوی نوشته گیتاشناسی، ravāg نمایانده می‌شود.  این کار  را تا زمانی انجام میدهیم که یاران یک چم هم برای electrical current به پهلوی پیشنهند. رای من این نیست که ravāg را برای electrical current نمیتوانیم به کار ببریم، چون براستی آن هم یک روان شدن است (روان شدن electron ها در یک رسانا مانند آهن یا مس). آماج من تنها نمایاندن یک نمونه بود برای اینکه این ویژگی نرم افزار را بنمایانم. یکی از انگیزه هایی که من پیشنهادم شمار واژگان این نرم افزار را بیشتر کنیم، به گونه ای که همه زبان های ایرانیگ و حتی زبان های هم خانواده مانند سنسکریت و گوجراتیگ را هم در بر بگیرد، برای  این است که شاید بتوانیم  با نگرش به همتای واژه در آن زبان‌ها، یک واژه هم برای بخش پهلویگ پیشنهیم. نمونه وار، ببینیم همتای electrical current در سنسکریت، اوستاییگ، گوجراتیگ، آسیگ، ارمنیگ،  خوارزمیگ، سغدیگ ، کردیگ ... چیست تا شاید بتوانیم یک واژه برای پهلویگ پیشنهیم.
از شیوه آوانگاری MacKenzie هم بهره برداری کردم، چون برای ساختن فرهنگ انگلیگ-پهلویگ برای این نرم افزار، ساده ترین راه به کار بردن واژگان جالپتره parsig.org بود که این شیوه را به کار برده‌ بودند. من گمان می‌کنم که اکنون، شیوه خوبیست، چون اگر نویسمان پهلویگ یا اوستاییگ یا میخوش را به کار ببریم، شمار بسیار کمی می توانند آنرا بخوانند، ولی شیوه آوانگاری MacKenzie را هم ایرانیگان و هم بیگانگان می‌توانند بخوانند. یکی دیگر از انگیزه های من برای به کار بردن شیوه MacKenzie در این نرم افزار این بود که زمانی که در نوشته پهلویگ شماره، ماه روز، نشانهایی مانند $, @, ?, !, /, ... یا هر وات یا واژه های بیگانه (مانند واژه electrical current در نمونه پیشین که از چپ به راست نوشته می‌شوند) باشند، پردازش نوشته (برای نمونه جداکردن واژگان از هم) با رایانه دشوار می‌شود، چون پهلویگ و اوستاییگ از راست به چپ نوشته می‌شوند. هرچند میپذیرم که این کار تنها برای شناساندن فرهنگ کهن ایران خوب است، ولی پژوهشنیگوار، برای زبان پهلویگ خوب نیست، چون به کار بردن نویسمان بیگانه می‌تواند به زبان آسیب برساند. نمی دانم آیا میتوانیم نویسمان میخوش ( چپ به راست) را برای پهلویگ به کار ببریم؟ این کار چاره دشواری دیم  است (پردازش نوشته با رایانه) ولی دشواری نخست همچنان پابرجاست (نا آشنایی بیشتر مردم با نویسمان میخوش). چشم به راه خواندن پیشنهگ در این زمینه ها هستم.
0
از سوی (4,357 تراز)
ویراست در از سوی

من از نویسمان (خط،دبیره) نگفتم. آوانویسی ی پهلویک دو گونه است : شیوه ی بارتلمه و شیوه مکنزی. اگر به نسکان گوناگون نگراد (بنگرید) هیچ یک آوانویسی یکسان ندارند. نمونه‌وار (برای مثال) برخ-ی واژه ی «پَیدا» را به شیوه ی مکنزی paydāg مینویسند که من میپدیرم و برخ-ی دیگر pētāg/k مینویسند که نمیپسندم و نمیپدیرم.

0
از سوی (2,031 تراز)
ویراست در از سوی

درود، درست میگویید، برای من مانند گونه دیم است، ولی همچنان که گفتم، چاره دیگری نداشتم، چون زمان کمی داشتم و می خواستم در چند روز (که در پایان، نزدیک به ۲ ماه شد)، فرهنگ واژگان را به گونه ای دگرگون کنم که رایانه بتواند بخواند، و با جویشی که کردم، بهترین راه، به کار بردن پهرست واژگان تارنمای parsig.org بود که آوانویسی دیم را به کار برده بودند. می‌توانم یک بند دیگر هم به پرونده README.md در GitHub بیافزایم، و در آن این کاستی را هم بنویسم. درست کردن همه این نادرستی ها، بسیار زمان بر است و یک تنه شدنی نیست. این کار نیاز به یاری همه یاران دارد.

0
از سوی

با پیشکش درودها و آرزوی کام وری برای رنجبر فرهنگ و زبان ایران زمین:

 ✏🔷🔷🔷یک #یافته_نو_باستانی و لزوم یک #بازنگری:

#اندیشه_ایرانشهری نیازمند رویکردی تلاش‌کرانه حقیقت گرایانه از سوی چابکان این زمینه است.

همان‌گونه که دانید و اگر در رسم الخط پهلوی معرفی شده توسط زبان شناسان بنگرید متوجه نوعی نارسایی می شوید که برونداد بازگردانی های اشتباه پژوهشگران حوزه زبان است نه نقص و ضعف زبان پهلوی.
 برای نمونه واج  | پهلوی را همزمان همسنگ " ر " "ن" " " و "  " اُ "می دانند که این اشتباهی فاحش است و چنین چیزی ناممکنست .
علت آن ایسنت که بن فعل "کر" که فعلی پرکاربرد در متن نوشته های پهلوی هست برای محققین ایرانی مقداری نامانوس بوده و آن را در تمام متون "کن "خوانده اند .فلذا با خود فکر کرده اند که حتما برای "ر" و"ن" یک حرف مشترک پهلوی استفاده شده است .در حالی است که میدانیم زبان پهلوی یک زبان غنی است و چنین فقری(فقر واج) در آن وجود ندارد.
در یک مورد دیگر نیز این خطا به چشم می خورد که نتیجه اشتباه نگاه به گرامر پهلوی است .
در زبان پهلوی و گویش های باقی مانده آن
سوم شخص مفرد پهلوی به "گ" و "إی" ختم می شود. مانند:نوسِئ( نوسِئگ):می نویسد.واژِئ(واژِئگ):می گوید.

در کمال تعجب می بینیم که حرف "د" رو برای واج مربوط به "گ" و "ی" هم در نظر  گرفتن که ابن هم اشتباه فاحشی است.
برای نمونه  هر کریاژه(فعلی) مثل: "کَرِئ:کرِئگ" و "وینِئ "وینِگ"خوَرِیگ "خورِئ"نِئگ"نِئ" :نوسِئ( نوسِئگ).واژِئ(واژِئگ)
که حتی در زبان محاوره ای مردم ایران نیز بدین شکل است, رو به صورت "کُنَد " ویند "خورَد "نَهَد"نویسد" و"واژد"
بازگردانی کرده اند و می کنند که بی گمان خطاست.

پس یکی از نیکوترین و ضروری ترین و نتیجه بخش ترین کارها بازخوانی زبان پهلوی بر مبنای حقیقت وجودی آن در متون و مردمان زنده آنست. 🌹🔶🔶🔶📌

0 تراز
از سوی (3,641 تراز)

درود بر شما

نخست کار ارزشمند شما را ارج می نهم و برای شما و یارانتان در این نیکو آرزوی کامیابی دارم .
دو دیگر اینکه نیاز است کمی پیرامون شیوه ی یاری رسانی آگاهی رسانی کنید . گمان دارم کسانی که بخواهند به شما یاری رسانند باید دانش رایانه ای بالایی داشته باشند از این روی اگر بتوانید راه یاری رسانی و ویرایش و افزایش واژگان را کمی آسانتر و هموارتر کنید, برآیند کار بهتر شود.
0
از سوی (2,031 تراز)
نمایش از نو از سوی

درود بر شما،


برای همکاری نیازی به دانش بالا در زمینه رایانه نیست. یاران تنها اگر بتوانند با برنامه Microsoft Excel کار کنند، به سادگی می‌توانند فرهنگ واژگان را ویرایش کنند (برای بار گیری فرهنگ واژگان، پرونده های unigrams.xlsx, verbs.xlsx, phrases.xlsx و  thesauras.xlsx را به نشانی https://github.com/judahjohnson/parsig?files=1 ببینید.) راندن این نرم افزار هم نیاز به دانش رایانه ای بالا ندارد و روش آنرا در بند هشتم پرونده README.md به نشانی https://github.com/judahjohnson/parsig/blob/master/README.md نوشته ام. اگر یاران هر پرسشی در این زمینه داشته باشند آماده پاسخگویی هستم. 
0
از سوی (3,641 تراز)

درود بر شما

پس از آنکه پرونده ویرایش شد چگونه باید آنرا فرستاد و به برنامه ی شما افزود ؟
0
از سوی (2,031 تراز)
ویراست در از سوی

درود،


خواهشمندم پرونده ها ی ویرایش شده را به جال پیک english.parsig@gmail.com بفرستید. اگر هم پهرستی از شماره cell های ویرایش شده را هم بنویسید (برای نمونه اگر C54 را ویرایش کردید در جال پیک بنویسید C54) یا در پرونده xlsx رنگ آن رج ها/ستون ها را دگرگون کنید (برای نمونه رنگ رج 54 ستون C را قرمز کنید) که بتوان دریافت کدام رج ها/ستون ها ویرایش شده‌اند هم که بسیار بهتر می شود.
0
از سوی (4,357 تراز)

بهتر است شیوه‌نامه-ای پدید آورای (بیاورید) که همه به یک شیوه کار کنانند و مانند ویکیپدیا هر کس رنج دیگر کسان را تباه نِکناد.

0
از سوی (2,031 تراز)
ویراست در از سوی

پیشنهگ بسیار خوبیست. می‌توانم یک شیوه نامه درباره چگونگی ویرایش، به زبان انگلیگ بنویسم و در GitHub بارگذاری کنم. برای اینکه کسی رنج دیگران را تباه نکند، باید یک سامانه داشته باشیم که همگان بتوانند ویرایش دیگران را ببینند. تا آنجا که میدانم، این کار در Wikipedia هم شدنیست و اگر کسی بخواهد، می‌تواند پهرست ویرایش های پیشین را ببیند و به جای واپسین ویرایش، بهترین ویرایش را از آن میان بر گزیند. زمانی که کسی نوشته را ویرایش می کند، نمیتوانیم ویرایشهای سپسین را پادیرانیم، چون هیچ گاه نمیدانیم درست ترین ویرایش برای چه کسی یا در چه هنگامی است. نمی‌دانم برای درست کردن چنین سامانه ای می توانیم از GitHub بهره بگیریم یا نه. به هرروی کمی بررسی می‌کنم، و سرانجام آنرا به آگاهی شما میرسانم.  

+1 تراز
از سوی

درُود ، بسیار از شما سپاسگزارم و امیدوارم همواره پیروز و سربلند باشید من هم به زبان پارسی پهلوی علاقه مند هستم 

گفتمان های پیشنهادی

+1 تراز
1 پاسخ
آغاز گفتمان ژوئن 3, 2023 در زبانشناسی از سوی فرزاد بتهایی
0 تراز
4 پاسخ
آغاز گفتمان می 19, 2017 در زبان و گویش از سوی pooya (128 تراز)
+3 تراز
3 پاسخ
آغاز گفتمان اکتبر 22, 2016 در زبان و گویش از سوی اوهردخت (125 تراز)
0 تراز
0 پاسخ
آغاز گفتمان دسامبر 29, 2021 در واژه شناسی-ریشه شناسی از سوی آرشا (1,167 تراز)
...