۱۶ شهریور ۱۴۰۴فارسی

کشف کنید که چگونه پروپوزال آتی Iterator Helpers در جاوا اسکریپت، با حذف آرایه‌های میانی و بهره‌گیری از ارزیابی تنبل (lazy evaluation)، پردازش داده را متحول کرده و به افزایش چشمگیر عملکرد منجر می‌شود.

جهش بعدی جاوا اسکریپت در عملکرد: نگاهی عمیق به ترکیب جریان (Stream Fusion) در Iterator Helper ها

در دنیای توسعه نرم‌افزار، تلاش برای دستیابی به عملکرد بهتر یک سفر همیشگی است. برای توسعه‌دهندگان جاوا اسکریپت، یک الگوی رایج و زیبا برای دستکاری داده‌ها، زنجیر کردن متدهای آرایه مانند .map()، .filter() و .reduce() است. این API روان، خوانا و گویا است، اما یک گلوگاه عملکردی مهم را پنهان می‌کند: ایجاد آرایه‌های میانی. هر مرحله در این زنجیره یک آرایه جدید ایجاد می‌کند که حافظه و چرخه‌های پردازنده را مصرف می‌کند. برای مجموعه‌داده‌های بزرگ، این می‌تواند یک فاجعه عملکردی باشد.

اینجاست که پروپوزال Iterator Helpers کمیته TC39 وارد می‌شود؛ یک افزودنی پیشگامانه به استاندارد ECMAScript که آماده است تا نحوه پردازش مجموعه‌های داده در جاوا اسکریپت را بازتعریف کند. در قلب این پروپوزال، یک تکنیک بهینه‌سازی قدرتمند به نام ترکیب جریان (stream fusion) (یا ترکیب عملیات) قرار دارد. این مقاله به بررسی جامع این پارادایم جدید می‌پردازد و توضیح می‌دهد که چگونه کار می‌کند، چرا اهمیت دارد و چگونه به توسعه‌دهندگان قدرت می‌دهد تا کدی کارآمدتر، با مصرف حافظه کمتر و قدرتمندتر بنویسند.

مشکل زنجیره‌سازی سنتی: حکایت آرایه‌های میانی

برای درک کامل نوآوری iterator helper ها، ابتدا باید محدودیت‌های رویکرد فعلی مبتنی بر آرایه را بشناسیم. بیایید یک وظیفه ساده و روزمره را در نظر بگیریم: از یک لیست از اعداد، می‌خواهیم پنج عدد زوج اول را پیدا کرده، آن‌ها را دو برابر کنیم و نتایج را جمع‌آوری کنیم.

رویکرد مرسوم

با استفاده از متدهای استاندارد آرایه، کد تمیز و قابل فهم است:

const numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ...]; // یک آرایه بسیار بزرگ را تصور کنید

const result = numbers .filter(n => n % 2 === 0) // مرحله ۱: فیلتر کردن اعداد زوج .map(n => n * 2) // مرحله ۲: دو برابر کردن آن‌ها .slice(0, 5); // مرحله ۳: برداشتن پنج مورد اول

این کد کاملاً خوانا است، اما بیایید ببینیم موتور جاوا اسکریپت در پشت صحنه چه کاری انجام می‌دهد، به خصوص اگر numbers حاوی میلیون‌ها عنصر باشد.

پیمایش ۱ (.filter()): موتور کل آرایه numbers را پیمایش می‌کند. یک آرایه میانی جدید در حافظه ایجاد می‌کند، بیایید آن را evenNumbers بنامیم، تا تمام اعدادی که از شرط عبور می‌کنند را در خود نگه دارد. اگر numbers یک میلیون عنصر داشته باشد، این آرایه می‌تواند تقریباً حاوی ۵۰۰,۰۰۰ عنصر باشد.
پیمایش ۲ (.map()): اکنون موتور کل آرایه evenNumbers را پیمایش می‌کند. یک آرایه میانی دوم ایجاد می‌کند، بیایید آن را doubledNumbers بنامیم، تا نتیجه عملیات نگاشت را ذخیره کند. این هم یک آرایه دیگر با ۵۰۰,۰۰۰ عنصر است.
پیمایش ۳ (.slice()): در نهایت، موتور با برداشتن پنج عنصر اول از doubledNumbers، یک آرایه نهایی سوم ایجاد می‌کند.

هزینه‌های پنهان

این فرآیند چندین مشکل عملکردی حیاتی را آشکار می‌کند:

تخصیص حافظه بالا: ما دو آرایه موقت بزرگ ایجاد کردیم که بلافاصله دور ریخته شدند. برای مجموعه‌داده‌های بسیار بزرگ، این می‌تواند منجر به فشار قابل توجهی بر حافظه شود و به طور بالقوه باعث کندی یا حتی از کار افتادن برنامه شود.
سربار Garbage Collection: هرچه اشیاء موقت بیشتری ایجاد کنید، garbage collector باید سخت‌تر کار کند تا آن‌ها را پاک کند، که باعث ایجاد وقفه‌ها و لکنت در عملکرد می‌شود.
محاسبات هدر رفته: ما میلیون‌ها عنصر را چندین بار پیمایش کردیم. بدتر از آن، هدف نهایی ما فقط به دست آوردن پنج نتیجه بود. با این حال، متدهای .filter() و .map() کل مجموعه داده را پردازش کردند و میلیون‌ها محاسبه غیرضروری را قبل از اینکه .slice() بیشتر کار را دور بریزد، انجام دادند.

این مشکل اساسی است که Iterator Helpers و stream fusion برای حل آن طراحی شده‌اند.

معرفی Iterator Helpers: پارادایمی جدید برای پردازش داده

پروپوزال Iterator Helpers مجموعه‌ای از متدهای آشنا را مستقیماً به Iterator.prototype اضافه می‌کند. این بدان معناست که هر شیئی که یک iterator باشد (شامل جنریتورها و نتیجه متدهایی مانند Array.prototype.values()) به این ابزارهای قدرتمند جدید دسترسی پیدا می‌کند.

برخی از متدهای کلیدی عبارتند از:

.map(mapperFn)
.filter(filterFn)
.take(limit)
.drop(limit)
.flatMap(mapperFn)
.reduce(reducerFn, initialValue)
.toArray()
.forEach(fn)
.some(fn)
.every(fn)
.find(fn)

بیایید مثال قبلی خود را با استفاده از این helper های جدید بازنویسی کنیم:

const numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ...];

const result = numbers.values() // ۱. گرفتن یک iterator از آرایه .filter(n => n % 2 === 0) // ۲. ایجاد یک filter iterator .map(n => n * 2) // ۳. ایجاد یک map iterator .take(5) // ۴. ایجاد یک take iterator .toArray(); // ۵. اجرای زنجیره و جمع‌آوری نتایج

در نگاه اول، کد بسیار شبیه به نظر می‌رسد. تفاوت کلیدی در نقطه شروع —numbers.values()— است که یک iterator را به جای خود آرایه برمی‌گرداند، و عملیات پایانی —.toArray()— که iterator را برای تولید نتیجه نهایی مصرف می‌کند. اما جادوی واقعی در اتفاقی است که بین این دو نقطه رخ می‌دهد.

این زنجیره هیچ آرایه میانی ایجاد نمی‌کند. در عوض، یک iterator جدید و پیچیده‌تر می‌سازد که iterator قبلی را در بر می‌گیرد. محاسبات به تعویق می‌افتد. در واقع هیچ اتفاقی نمی‌افتد تا زمانی که یک متد پایانی مانند .toArray() یا .reduce() برای مصرف مقادیر فراخوانی شود. این اصل ارزیابی تنبل (lazy evaluation) نامیده می‌شود.

جادوی ترکیب جریان (Stream Fusion): پردازش یک عنصر در هر زمان

ترکیب جریان مکانیزمی است که ارزیابی تنبل را بسیار کارآمد می‌کند. به جای پردازش کل مجموعه در مراحل جداگانه، هر عنصر را به صورت جداگانه از کل زنجیره عملیات عبور می‌دهد.

تشبیه خط مونتاژ

یک کارخانه تولیدی را تصور کنید. روش سنتی آرایه مانند داشتن اتاق‌های جداگانه برای هر مرحله است:

اتاق ۱ (فیلتر کردن): تمام مواد خام (کل آرایه) وارد می‌شوند. کارگران مواد بد را جدا می‌کنند. مواد خوب همگی در یک سطل بزرگ (اولین آرایه میانی) قرار می‌گیرند.
اتاق ۲ (نگاشت): کل سطل مواد خوب به اتاق بعدی منتقل می‌شود. در اینجا، کارگران هر مورد را تغییر می‌دهند. موارد تغییر یافته در یک سطل بزرگ دیگر (دومین آرایه میانی) قرار می‌گیرند.
اتاق ۳ (برداشتن): سطل دوم به اتاق نهایی منتقل می‌شود، جایی که یک کارگر به سادگی پنج مورد اول را از بالا برمی‌دارد و بقیه را دور می‌ریزد.

این فرآیند از نظر حمل و نقل (تخصیص حافظه) و نیروی کار (محاسبات) پرهزینه است.

ترکیب جریان، که توسط iterator helper ها قدرت گرفته، مانند یک خط مونتاژ مدرن است:

یک نوار نقاله واحد از تمام ایستگاه‌ها عبور می‌کند.
یک مورد روی نوار قرار می‌گیرد. به ایستگاه فیلتر کردن می‌رود. اگر رد شود، حذف می‌شود. اگر عبور کند، ادامه می‌دهد.
بلافاصله به ایستگاه نگاشت می‌رود، جایی که تغییر داده می‌شود.
سپس به ایستگاه شمارش (take) می‌رود. یک ناظر آن را می‌شمارد.
این کار، یک مورد در هر زمان، ادامه می‌یابد تا زمانی که ناظر پنج مورد موفق را شمرده باشد. در آن لحظه، ناظر فریاد می‌زند «توقف!» و کل خط مونتاژ خاموش می‌شود.

در این مدل، هیچ سطل بزرگی از محصولات میانی وجود ندارد و خط به محض اتمام کار متوقف می‌شود. این دقیقاً نحوه عملکرد ترکیب جریان در iterator helper ها است.

تجزیه و تحلیل گام به گام

بیایید اجرای مثال iterator خود را ردیابی کنیم: numbers.values().filter(...).map(...).take(5).toArray().

.toArray() فراخوانی می‌شود. به یک مقدار نیاز دارد. از منبع خود، یعنی iterator take(5)، اولین موردش را درخواست می‌کند.
iterator take(5) برای شمارش به یک مورد نیاز دارد. از منبع خود، یعنی iterator map، یک مورد درخواست می‌کند.
iterator map برای تبدیل به یک مورد نیاز دارد. از منبع خود، یعنی iterator filter، یک مورد درخواست می‌کند.
iterator filter برای آزمایش به یک مورد نیاز دارد. اولین مقدار را از iterator آرایه منبع می‌کشد: 1.
سفر عدد '1': فیلتر شرط 1 % 2 === 0 را بررسی می‌کند. این false است. iterator فیلتر 1 را دور می‌اندازد و مقدار بعدی را از منبع می‌کشد: 2.
سفر عدد '2':
- فیلتر شرط 2 % 2 === 0 را بررسی می‌کند. این true است. 2 را به iterator map پاس می‌دهد.
- iterator map عدد 2 را دریافت می‌کند، 2 * 2 را محاسبه می‌کند و نتیجه، یعنی 4، را به iterator take پاس می‌دهد.
- iterator take عدد 4 را دریافت می‌کند. شمارنده داخلی خود را کاهش می‌دهد (از 5 به 4) و 4 را به مصرف‌کننده toArray() می‌دهد. اولین نتیجه پیدا شد.
toArray() یک مقدار دارد. از take(5) مقدار بعدی را درخواست می‌کند. کل فرآیند تکرار می‌شود.
فیلتر 3 را می‌کشد (رد می‌شود)، سپس 4 (عبور می‌کند). 4 به 8 نگاشت می‌شود و توسط take برداشته می‌شود.
این کار ادامه می‌یابد تا زمانی که take(5) پنج مقدار را تولید کند. پنجمین مقدار از عدد اصلی 10 خواهد بود که به 20 نگاشت می‌شود.
به محض اینکه iterator take(5) پنجمین مقدار خود را تولید می‌کند، می‌داند که کارش تمام شده است. دفعه بعد که از آن مقداری خواسته شود، سیگنال اتمام را می‌دهد. کل زنجیره متوقف می‌شود. اعداد 11، 12 و میلیون‌ها عدد دیگر در آرایه منبع هرگز حتی بررسی نمی‌شوند.

مزایای آن بی‌شمار است: بدون آرایه‌های میانی، حداقل استفاده از حافظه، و توقف محاسبات در اولین فرصت ممکن. این یک تغییر بنیادی در کارایی است.

کاربردهای عملی و دستاوردهای عملکردی

قدرت iterator helper ها بسیار فراتر از دستکاری ساده آرایه‌ها است. این قابلیت، امکانات جدیدی را برای انجام وظایف پیچیده پردازش داده به طور کارآمد باز می‌کند.

سناریوی ۱: پردازش مجموعه‌داده‌های بزرگ و استریم‌ها

تصور کنید نیاز به پردازش یک فایل لاگ چند گیگابایتی یا یک جریان داده از یک سوکت شبکه دارید. بارگذاری کل فایل در یک آرایه در حافظه اغلب غیرممکن است.

با iterator ها (و به خصوص async iterator ها، که بعداً به آنها خواهیم پرداخت)، می‌توانید داده‌ها را تکه به تکه پردازش کنید.

// مثال مفهومی با یک جنریتور که خطوط یک فایل بزرگ را تولید می‌کند function* readLines(filePath) { // پیاده‌سازی که یک فایل را خط به خط بدون بارگذاری کامل آن می‌خواند // yield line; } const errorCount = readLines('huge_app.log').values() .map(line => JSON.parse(line)) .filter(logEntry => logEntry.level === 'error') .take(100) // پیدا کردن ۱۰۰ خطای اول .reduce((count) => count + 1, 0);

در این مثال، در هر لحظه فقط یک خط از فایل در حافظه قرار دارد در حالی که از طریق خط لوله عبور می‌کند. برنامه می‌تواند ترابایت‌ها داده را با حداقل ردپای حافظه پردازش کند.

سناریوی ۲: خاتمه زودهنگام و اتصال کوتاه (Short-Circuiting)

ما قبلاً این را با .take() دیدیم، اما این برای متدهایی مانند .find()، .some() و .every() نیز صدق می‌کند. یافتن اولین کاربری که در یک پایگاه داده بزرگ مدیر است را در نظر بگیرید.

مبتنی بر آرایه (ناکارآمد):

const firstAdmin = users.filter(u => u.isAdmin)[0];

در اینجا، .filter() کل آرایه users را پیمایش می‌کند، حتی اگر اولین کاربر مدیر باشد.

مبتنی بر Iterator (کارآمد):

const firstAdmin = users.values().find(u => u.isAdmin);

helper .find() هر کاربر را یکی یکی آزمایش می‌کند و به محض یافتن اولین مورد منطبق، کل فرآیند را بلافاصله متوقف می‌کند.

سناریوی ۳: کار با دنباله‌های نامتناهی

ارزیابی تنبل امکان کار با منابع داده بالقوه نامتناهی را فراهم می‌کند، که با آرایه‌ها غیرممکن است. جنریتورها برای ایجاد چنین دنباله‌هایی عالی هستند.

function* fibonacci() { let a = 0, b = 1; while (true) { yield a; [a, b] = [b, a + b]; } } // پیدا کردن ۱۰ عدد فیبوناچی اول بزرگتر از ۱۰۰۰ const result = fibonacci() .filter(n => n > 1000) .take(10) .toArray(); // result خواهد بود [1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393]

این کد به خوبی اجرا می‌شود. جنریتور fibonacci() می‌تواند تا ابد اجرا شود، اما چون عملیات تنبل هستند و .take(10) یک شرط توقف فراهم می‌کند، برنامه فقط به تعداد لازم اعداد فیبوناچی را برای برآورده کردن درخواست محاسبه می‌کند.

نگاهی به اکوسیستم گسترده‌تر: Async Iterators

زیبایی این پروپوزال این است که فقط به iterator های همزمان (synchronous) محدود نمی‌شود. این پروپوزال همچنین مجموعه موازی از helper ها را برای Async Iterators در AsyncIterator.prototype تعریف می‌کند. این یک تغییردهنده بازی برای جاوا اسکریپت مدرن است، جایی که جریان‌های داده ناهمزمان (asynchronous) همه جا هستند.

پردازش یک API صفحه‌بندی شده، خواندن یک جریان فایل از Node.js، یا مدیریت داده‌ها از یک WebSocket را تصور کنید. همه اینها به طور طبیعی به عنوان جریان‌های ناهمزمان نمایش داده می‌شوند. با async iterator helper ها، می‌توانید از همان سینتکس اعلانی .map() و .filter() برای آنها استفاده کنید.

// مثال مفهومی از پردازش یک API صفحه‌بندی شده async function* fetchAllUsers() { let url = '/api/users?page=1'; while (url) { const response = await fetch(url); const data = await response.json(); for (const user of data.users) { yield user; } url = data.nextPageUrl; } } // پیدا کردن ۵ کاربر فعال اول از یک کشور خاص const activeUsers = await fetchAllUsers() .filter(user => user.isActive) .filter(user => user.country === 'DE') .take(5) .toArray();

این مدل برنامه‌نویسی برای پردازش داده در جاوا اسکریپت را یکپارچه می‌کند. چه داده‌های شما در یک آرایه ساده در حافظه باشند یا یک جریان ناهمزمان از یک سرور راه دور، می‌توانید از همان الگوهای قدرتمند، کارآمد و خوانا استفاده کنید.

شروع کار و وضعیت فعلی

از اوایل سال ۲۰۲۴، پروپوزال Iterator Helpers در مرحله ۳ فرآیند TC39 قرار دارد. این بدان معناست که طراحی کامل شده است و کمیته انتظار دارد که در استاندارد آینده ECMAScript گنجانده شود. اکنون در انتظار پیاده‌سازی در موتورهای اصلی جاوا اسکریپت و بازخورد از آن پیاده‌سازی‌ها است.

چگونه امروز از Iterator Helpers استفاده کنیم

محیط‌های اجرایی مرورگر و Node.js: آخرین نسخه‌های مرورگرهای اصلی (مانند Chrome/V8) و Node.js در حال شروع به پیاده‌سازی این ویژگی‌ها هستند. ممکن است برای دسترسی بومی به آنها نیاز به فعال کردن یک فلگ خاص یا استفاده از یک نسخه بسیار جدید داشته باشید. همیشه آخرین جداول سازگاری را بررسی کنید (به عنوان مثال، در MDN یا caniuse.com).
پلی‌فیل‌ها (Polyfills): برای محیط‌های تولیدی که نیاز به پشتیبانی از محیط‌های اجرایی قدیمی‌تر دارند، می‌توانید از یک پلی‌فیل استفاده کنید. رایج‌ترین راه از طریق کتابخانه core-js است که اغلب توسط ترنسپایلرهایی مانند Babel گنجانده می‌شود. با پیکربندی Babel و core-js، می‌توانید با استفاده از iterator helper ها کد بنویسید و آن را به کد معادل که در محیط‌های قدیمی‌تر کار می‌کند، تبدیل کنید.

نتیجه‌گیری: آینده پردازش کارآمد داده در جاوا اسکریپت

پروپوزال Iterator Helpers چیزی بیش از مجموعه‌ای از متدهای جدید است؛ این یک تغییر اساسی به سمت پردازش داده کارآمدتر، مقیاس‌پذیرتر و گویاتر در جاوا اسکریپت را نشان می‌دهد. با پذیرش ارزیابی تنبل و ترکیب جریان، مشکلات عملکردی دیرینه مرتبط با زنجیره‌سازی متدهای آرایه روی مجموعه‌داده‌های بزرگ را حل می‌کند.

نکات کلیدی برای هر توسعه‌دهنده عبارتند از:

عملکرد به طور پیش‌فرض: زنجیره‌سازی متدهای iterator از ایجاد مجموعه‌های میانی جلوگیری می‌کند و به طور چشمگیری مصرف حافظه و بار garbage collector را کاهش می‌دهد.
کنترل بهبودیافته با تنبلی (Laziness): محاسبات فقط در صورت نیاز انجام می‌شوند، که امکان خاتمه زودهنگام و مدیریت زیبای منابع داده نامتناهی را فراهم می‌کند.
یک مدل یکپارچه: همان الگوهای قدرتمند هم برای داده‌های همزمان و هم ناهمزمان اعمال می‌شود، که کد را ساده کرده و استدلال در مورد جریان‌های داده پیچیده را آسان‌تر می‌کند.

با تبدیل شدن این ویژگی به بخش استانداردی از زبان جاوا اسکریپت، سطوح جدیدی از عملکرد را باز خواهد کرد و به توسعه‌دهندگان قدرت می‌دهد تا برنامه‌های قوی‌تر و مقیاس‌پذیرتری بسازند. وقت آن است که به صورت جریانی (stream) فکر کنید و برای نوشتن کارآمدترین کد پردازش داده در حرفه خود آماده شوید.