ریاضی
آموزش‌های پیشرفته هوش مصنوعیپردازش زبان طبیعیکاربردهای هوش مصنوعی

حل مسائل ریاضی به وسیله هوش مصنوعی

    0
    زمان مطالعه: ۱۸ دقیقه

    محققان، سیستمی جدید ساخته‌اند که برای حل مسائل ریاضی دبستان آموزش دیده است. دقت این سیستم، نزدیک به دوبرابر مدل GPT-3 است که به دقت تنظیم شده باشد. این مدل می‌تواند ۹۰ درصد مسائلی را که دانش‌آموزان حل کرده‌اند، پاسخ دهد. در این پروژه، نمونه‌ کوچکی از کودکان ۹ تا ۱۲ ساله به یکی از امتحانات ریاضی موجود در دیتاست پاسخ داده و نمره‌ ۶۰ درصد گرفته‌اند. سیستم مذکور در همین امتحان عملکرد ۵۵ درصد داشته است. شاید از خود بپرسید اهمیت این دستاورد چیست؟ در پاسخ باید گفت که درحال‌حاضر، هوش مصنوعی در استدلال چندگامی و عقل سلیم عملکردی ضعیف دارد؛ این‌ها مسائلی هستند که حتی کودکان دبستانی هم به آسانی از پس آن بر می‌آیند. این مدل به نحوی آموزش دیده، تا متوجه اشتباه‌های خودش بشود و روند استدلالی خود را آنقدر تکرار کند، تا بالاخره به راه‌حل درست دست یابد.

    مدل‌های زبانی بزرگ

    مدل‌های زبانی بزرگ همچون GPT-3 مهارت‌هایی خارق‌العاده دارند که از جمله‌ آن‌ها می‌توان به قابلیت تقلید سبک‌های نوشتاری مختلف و دانش عمومی گسترده‌شان اشاره کرد. با این حال، این مدل‌ها در حل مسائلی که نیاز به استدلال دقیق چندمرحله‌ای دارند، همچون حل مسائل ریاضی دبستان، به مشکل بر می‌خورند. این مدل‌ها می‌‌توانند فرایند راه‌حل‌های درست را تقلید کنند؛ اما در منطق خود مرتکب اشتباه‌های بحرانی می‌شوند.

    مدل‌ها برای اینکه بتوانند در فرایندهای منطقی پیچیده، عملکردی در سطح انسان‌ها داشته باشند، باید اشتباه‌های خود‌شان را تشخیص دهند و قدم‌هایشان را با دقت انتخاب کنند. اینجاست که مدل‌های اعتبارسنج وارد کار می‌شوند و صحت راهکارهای پیشنهادی را می‌سنجند. در این پروژه، برای ارزیابی روش‌ها از دیتاست جدید GSM8K استفاده شده است؛ محققان، این دیتاست را در دسترس عموم قرار داده‌اند.

    در این قسمت، ده مثال از مسائل ریاضی دبستان را مشاهده می‌کنید که به جز راه‌حل و نتایج مدل جدید، راه‌حل‌های مدل اعتبارسنج، مدل خط پایه و مدل «به دقت تنظیم‌شده» را نیز نشان می‌دهند.

    مسئله ریاضی اول

    علی در یک مدرسه‌ خصوصی مشغول به کار است و یک کلاس تدریس می‌کند. جان در مدرسه‌ای دولتی کار می‌کند و دو کلاس دارد. هر کدام از کلاس‌های جان، یک هشتم کلاس علی گنجایش دارند. کلاس علی ۱۲۰ دانش‌آموز دارد. گنجایش هر دو مدرسه جمعاً چقدر است؟
    Method: 175B Verification

    Ali’s class has a capacity of 120 students.

    کلاس علی ۱۲۰ نفر گنجایش دارد.

    Each of John’s classes has a capacity of 120/8 = 15 students.

    هر کدام از کلاس‌های جان، یک هشتم کلاس علی گنجایش دارند؛ در نتیجه: ۱۵=۸÷۱۲۰

    The total capacity of John’s two classes is 15 students * 2 classes = 30 students.

    گنجایش دو کلاس جان برابر است با: ۳۰=۱۵×۲

    The combined capacity of the two schools is 120 students + 30 students = 150 students.

    گنجایش هر دو مدرسه برابر است با: ۱۵۰=۱۲۰+۳۰

    Method: 175B Fine-tuning

    Each of John’s classes has the capacity of 120 students / 8 = 15 students.

    گنجایش هر کدام از کلاس‌های جان، برابر یک هشتم کلاس علی است؛ بنابراین: ۱۵= ۸÷۱۲۰

    So, the two classes that John teaches have a combined capacity of 15 students * 2 = 30 students.

    دو کلاسی که جان درس می‌دهد، جمعاً ۳۰=۱۵×۲ نفر دانش‌آموز دارند.

    Ali’s class has a capacity of 120 students * 1 = 120 students.

    کلاس علی ۱۲۰ نفر گنجایش دارد و چون یک کلاس درس می‌دهد، پس: ۱۲۰=۱۲۰×۱

    Thus, the total capacity of Ali’s school is 120 students + 30 students = 150 students.

    بنابراین گنجایش کل مدرسه‌ علی برابر است با: ۱۵۰=۱۲۰+۳۰

    Therefore, the combined capacity of both schools is 150 students + 30 students = 180 students.

    در آخر، گنجایش هر دو مدرسه با هم برابر است با: ۱۸۰=۱۵۰+۳۰

    Method: 6B Fine-tuning

    Ali has 120 students in one class and there are 8 students in each of his classes so he has 120/8 = 15 classes

    علی ۱۲۰ دانش‌آموز در یک کلاس دارد و در هر کلاسش ۸ دانش‌آموز دارد. پس در کل ۱۵=۸÷۱۲۰ کلاس دارد.

    The total capacity of all of his classes is 15*120 = 1800 students

    گنجایش کل کلاس‌هایش برابر با ۱۸۰۰=۱۲۰×۱۵ دانش‌آموز است.

    John has two classes with 1/8 the capacity of Ali’s class each so he has 2*15 = 30 students in each of his classes

    جان دو کلاس دارد که ۸/۱ ظرفیت کلاس علی، دانش‌آموز دارد؛ پس ۲ کلاس ۱۵ نفره دارد که جمعاً ۳۰=۲×۱۵ دانش‌آموز دارند.

    The total capacity of both of John’s classes is 30*2 = 60 students

    گنجایش کل کلاس‌های جان برابر است با: ۶۰=۳×۲۰

    Combined, the total capacity of both schools is 1800+60 = 1860 students

    در کل، گنجایش کلاس‌های هر دو نفر برابر است با: ۱۸۶۰=۶۰+۱۸۰۰

    Method: 6B Verification

    If each class has 1/8 of the capacity of Ali’s class, the combined capacity of John’s classes is 1/8*120=15.0

    اگر هر کلاس ۸/۱ کلاس علی گنجایش داشته باشد، مجموع ظرفیت کلاس‌های جان برابر است با ۱۵= ۸/۱×۱۲۰

    Combined, the two schools have the capacity of 15.0+120=135.0

    در کل، دو مدرسه با هم ۱۳۵=۱۵+۱۲۰ نفر دانش‌آموز دارند.

    مسئله‌ ریاضی دوم

    تیم ۵ درخت می‌کارد. هر سال ۶ لیمو از هر درخت برداشت می‌کند. بعد از ده سال، تیم چند لیمو از درخت‌هایش می‌گیرد؟
    Method: 175B Verification

    He gets 5*6=30 lemons per year

    تیم ۳۰=۵×۶ لیمو در هر سال می‌گیرد

    He gets 30*10=300 lemons in 10 years

    تیم در هر ۱۰ سال، ۳۰۰=۱۰×۳۰ لیمو می‌گیرد

    Method: 175B Fine-tuning

    He grows 5*12=60 trees

    تیم ۶۰=۵×۱۲ درخت دارد

    So he gets 60*6=360 lemons a year

    پس تیم در هر سال ۳۶۰=۶۰×۶۰ لیمو می‌گیرد

    That means he gets 360*10=3600 lemons in a decade

    تیم در طی ده سال، ۳۶۰۰=۱۰×۳۶۰ لیمو از درخت‌هایش می‌گیرد

    Method: 6B Verification

    Tim collects a total of 5*6= 30 lemons per tree.

    تیم در هر سال، از همه‌ درخت‌هایش ۳۰=۵×۶ لیمو می‌چیند

    So in a decade, he gets 30*10= 300 lemons.

    پس در ده سال، او ۳۰۰=۱۰×۳۰ لیمو جمع خواهد کرد

    Method: 6B Fine-tuning

    He gets 5*6=30 lemons a year

    تیم در هر سال ۳۰=۵×۶ لیمو می‌چیند

    So he gets 30*10=300 lemons in a decade

    پس در ده سال، او ۳۰۰=۱۰×۳۰ لیمو جمع خواهد کرد

     

    مسئله‌ ریاضی سوم

    آنتونی ۵۰ مداد دارد. او یک دوم مدادهایش را به برندون می‌دهد و سه پنجم از آنچه برایش باقی مانده، به چارلی می‌دهد. چند مداد برای آنتونی باقی می‌ماند؟
    Method: 175B Verification

    Anthony gave 50/2= 25 pencils to Brandon.

    آنتونی ۲۵=۲÷۵۰ مداد به برندون داده است

    After giving Brandon 25 pencils, Anthony had 50-25= 25 pencils left.

    بعد از اینکه او ۲۵ مداد به برندون می‌دهد، ۲۵=۲۵-۵۰ مداد برایش باقی می‌ماند

    Anthony gave 25*3/5= 15 pencils to Charlie.

    آنتونی ۱۵=۵/۳÷۲۵ تا از مدادهایش را به چارلی می‌دهد

    After giving Charlie 15 pencils, Anthony had 25-15= 10 pencils left.

    بعد از اینکه ۱۵ مداد به چارلی می‌دهد، ۱۰=۱۵-۲۵ مداد برایش باقی می‌ماند

    Therefore, Anthony kept 10 pencils.

    پس در آخر، ۱۰ مداد برای آنتونی باقی می‌ماند

    Method: 175B Fine-tuning

    Anthony gave Brandon 50 x 1/2 = 25 pencils.

    آنتونی ۲۵=۲/۱÷۵۰ مداد به برندون داده است

    So he had 50 – ۲۵ = ۲۵ pencils left.

    پس ۲۵=۲۵-۵۰ مداد برایش باقی می‌ماند

    Charlie received 25 x 3/5 = 15 pencils.

    چارلی ۱۵=۵/۳×۲۵ مداد می‌گیرد

    Thus, Anthony kept 25 – ۱۵ = ۱۰ pencils.

    پس آنتونی ۱۰=۱۵-۲۵ مداد برای خودش نگه می‌دارد

    Method: 6B Verification

    Anthony gave 1/2 * 50 = 25.0 pencils to Brandon.

    آنتونی ۲۵=۵۰×۲/۱ مداد به برندون می‌دهد

    There are 50 – ۲۵ = ۲۵ pencils left.

    ۲۵=۲۵-۵۰ مداد باقی می‌ماند

    He gave 3/5 * 25 = 15.0 pencils to Charlie.

    آنتونی ۱۵=۲۵×۵/۳ مداد به چارلی می‌دهد

    Anthony kept 25 – ۱۵ = ۱۰.۰ pencils.

    آنتونی ۱۰=۱۵-۲۵ مداد برای خودش نگه می‌دارد

    Method: 6B Fine-tuning

    Anthony gave Brandon 50 / 2 = 25.0 pencils.

    آنتونی ۲۵=۲÷۵۰ مداد به برندون می‌دهد

    Anthony gave Charlie 50 / 3 = 16.666666666666668 pencils.

    آنتونی ۶۶۶۶۶۶۶۶۶۶۶۶۶۶۸/۱۶=۳×۵۰ مداد به چارلی می‌دهد

    So, Anthony gave a total of 25 + 16 = 41 pencils to Brandon and Charlie.

    پس آنتونی در کل ۴۱=۱۶+۲۵ مداد به برندون و چارلی می‌دهد

    Therefore, Anthony kept 50 – ۴۱ = ۹ pencils.

    در آخر، ۹=۴۱-۵۰ برای آنتونی باقی می‌ماند

     

    مسئله‌ ریاضی چهارم

    جان به خانه‌ دوستش می‌رود که در فاصله‌ ۲۰۰ مایلی او قرار دارد. او با سرعت ۷۰ مایل در ساعت رانندگی می‌کند. او مسیر فرعی‌ای را انتخاب می‌کند که ۱۰ مایل به مسیرش اضافه می‌کند. او بعد از رسیدن به مقصد، از مسیری ۲۴۰ مایلی به خانه بر می‌گردد، اما با سرعت ۸۰ مایل در ساعت رانندگی می‌کند. سفر او در کل چند ساعت طول کشیده است؟
    Method: 175B Verification

    The trip took 200+10=210 miles

    مسافتی که جان طی می‌کند ۲۱۰=۱۰+۲۰۰ مایل است

    He drove 70 mph for 210 miles so he drove for 210/70=3 hours

    او مسافت ۲۱۰ مایلی را با سرعت ۷۰ مایل بر ساعت طی می‌کند؛ پس ۳=۷۰÷۲۱۰ ساعت در راه است

    The route home was 240 miles and he drove 80 mph so he was driving for 240/80=3 hours

    مسیر برگشت ۲۴۰ مایل است و جان با سرعت ۸۰ مایل بر ساعت حرکت می‌کند. پس ۳=۸۰÷۲۴۰ ساعت در راه است

    The total trip took 3+3=6 hours

    کل سفر او ۶=۳+۳ ساعت طول می‌کشد

    Method: 175B Fine-tuning

    The trip to his friend’s house was 200+10=210 miles

    سفر جان به خانه‌ دوستش ۲۱۰=۱۰+۲۰۰ مایل است

    So the total trip was 210+240=450 miles

    پس کل مسافتی که جان سفر می‌کند، ۴۵۰=۲۱۰+۲۴۰ مایل است

    That means it took 450/70=6 hours

    پس در کل، سفر جان ۶=۷۰÷۴۵۰ ساعت طول می‌کشد

    Method: 6B Verification

    He drives 200+10=210 miles

    جان ۲۱۰=۱۰+۲۰۰ مایل سفر می‌کند

    So his trip took 210/70=3 hours

    پس سفرش ۳=۷۰÷۲۱۰ ساعت طول می‌کشد

    His route home was 240/80=3 hours

    سفر برگشت جان ۳=۸۰÷۲۴۰ ساعت طول می‌کشد

    So his trip took 3+3=6 hours

    پس در کل، سفر جان ۶=۳+۳ ساعت طول می‌کشد

    Method: 6B Fine-tuning

    The trip started at 7PM and he arrived at 12AM so it took 200-12=188 hours

    جان ساعت ۷ راه می‌افتد و ۱۲ نیمه‌شب به مقصد می‌رسد. پس زمان سفرش ۱۸۸=۱۲-۲۰۰ ساعت است

    He added 10 miles to the main trip so 10+188 = 198 miles

    ۱۰ مایل به مسافتش اضافه شده است؛ پس کل سفر ۱۹۸=۱۸۸+۱۰ مایل است

    He traveled 240-198 = 42 miles on the way home

    او در مسیر برگشت به خانه ۴۲=۱۹۸-۲۴۰ مایل رانندگی کرده است

    He went 80 mph for 240 miles so the trip took 240/80 = 3 hours

    او ۲۴۰ مایل مسافت برگشت به خانه را با سرعت ۸۰ مایل بر ساعت حرکت کرده است؛ پس ۳=۸۰÷۲۴۰ ساعت در راه است

    So in total it took 188+42 = 230 hours

    پس کل سفر او ۲۳۰=۴۲+۱۸۸ ساعت طول می‌کشد

     

    مسئله‌ ریاضی پنجم

    ریچارد، جری و رابرت، ۶۰ گیلاس دارند. اگر رابرت ۳۰ گیلاس داشته باشد و تعداد گیلاس‌هایش ۱۰ تا از گیلاس‌های ریچارد بیشتر باشد، رابرت چند گیلاس بیشتر از جری دارد؟
    Method: 175B Verification

    Robert has 30 + 10 = 40 cherries.

    رابرت ۴۰=۱۰+۳۰ گیلاس دارد

    If there are 60 cherries to be shared, then Richard and Jerry will have 60 – ۴۰ = ۲۰ cherries each.

    اگر جمعاً ۶۰ گیلاس وجود داشته باشد، ریچارد و جری هر کدام ۲۰=۴۰-۶۰ گیلاس دارند

    Robert has 40 – ۲۰ = ۲۰ more cherries than Jerry.

    تعداد گیلاس‌های رابرت ۲۰=۲۰-۴۰ تا بیشتر از جری است

    Method: 175B Fine-tuning

    Robert has 30 + 10 = 40 cherries.

    رابرت ۴۰=۱۰+۳۰ گیلاس دارد

    Richard has 40 – ۱۰ = ۳۰ cherries.

    ریچارد ۳۰=۱۰-۴۰ گیلاس دارد

    Jerry has 30 – ۳۰ = ۰ cherries.

    جری ۰=۳۰-۳۰ گیلاس دارد

    Robert has 40 – ۰ = ۴۰ more cherries than Jerry.

    پس رابرت ۴۰=۰-۴۰ گیلاس بیشتر از جری دارد

    Method: 6B Verification

    If Robert has 30 cherries, and has 10 more cherries than Richard, he has 30+10 = 40 cherries.

    اگر رابرت ۳۰ گیلاس داشته باشد و تعداد گیلاس‌هایش ۱۰ تا بیشتر از ریچارد باشد، جمعاً ۴۰=۱۰+۳۰ گیلاس دارد

    Since Jerry has 60 cherries, Robert has 60-40 = 20 more cherries than Jerry.

    جری ۶۰ گیلاس دارد، پس رابرت ۲۰=۴۰-۶۰ گیلاس بیشتر از جری دارد

    Method: 6B Fine-tuning

    If Robert has 30 cherries, and Richard has 30+10 = 40 cherries,

    اگر رابرت ۳۰ گیلاس داشته باشد، ریچارد ۴۰=۱۰+۳۰ گیلاس دارد

    Robert has 40-30 = 10 more cherries than Jerry.

    رابرت ۱۰=۳-۴۰ گیلاس بیشتر از جری دارد

     

    مسئله‌ ریاضی ششم

    کاترین می‌خواهد ۵ سبد هدیه درست کند. او می‌خواهد در هر سبد، ۳ گل اطلسی و ۲ گل سیب‌زمینی شیرین بگذارد. گل اطلسی‌ها هر کدام ۳ دلار و گل‌های سیب‌زمینی شیرین هر کدام ۵/۲ دلار هستند. کاترین برای پر کردن ۵ سبد چقدر باید هزینه کند؟
    Method: 175B Verification

    She needs 3 petunias per basket and she has 5 baskets, so she needs 3*5 = 15.00 worth of petunias

    کاترین برای پر کردن هر سبد به ۳ گل اطلسی نیاز دارد و می‌خواهد ۵ سبد را پر کند. پس ۱۵=۵×۳ دلار قیمت گل‌های اطللسی می‌شود

    She also needs 2 sweet potato vines per basket and she has 5 baskets, so she needs 2*5 = 10.00 worth of sweet potato vines

    کاترین در هر سبد ۲ گل سیب‌زمینی شیرین قرار می‌دهد و چون می‌خواهد ۵ سبد پر کند، ۱۰=۵×۲ دلار باید برای گل‌های سیب‌زمینی شیرین هزینه کند

    In total she needs 15.00 worth of petunias and 10.00 worth of sweet potato vines for a total of 15+10 = 25.00

    در کل، ۱۵ دلار، هزینه‌ گل‌های اطلسی و ۱۰ دلار قیمت گل‌های سیب‌زمینی شیرین می‌شود؛ پس هزینه‌ کل ۲۵=۱۰+۱۵ دلار است

    Method: 175B Fine-tuning

    She wants 3 petunias in each basket and they cost $3.00 each so that’s 3*3 = $9.00

    کاترین در هر سبد ۳ گل اطلسی دارد که هر کدام ۳ دلار هستند. پس برای قیمت گل‌های اطلسی هر سبد ۹=۳×۳ دلار می‌شود

    She wants 2 sweet potato vines in each basket and they cost $2.50 each so that’s 2*2.50 = $5.00

    او در هر سبد ۲ گل سیب‌زمینی شیرین دارد که هر کدام ۵/۲ دلار هستند. پس قیمت گل‌های سیب‌زمینی شیرین هر سبد ۵=۵/۲×۲ دلار می‌شود

    The petunias cost $9.00 and the sweet potato vines cost $5.00 for a total of 9+5 = $14.00 per basket

    قیمت گل‌های اصلی هر سبد ۹ دلار و قیمت گل‌های دیگر هر سبد ۵ دلار هستند. پس برای هزینه‌ درست کردن هر سبد ۱۴=۵+۹ دلار است

    She has 5 hanging baskets to fill and they cost $14.00 each so she will spend 5*14 = $70.00 filling all 5 baskets

    کاترین می‌خواهد ۵ سبد درست کند که هر کدام ۱۴ دلار هستند؛ پس در کل باید ۷۰=۱۴×۵ دلار هزینه کند

    Method: 6B Verification

    For the petunias, Katherine will spend 5 petunias x $3.00/petunia = $15.00

    کاترین برای گل‌های اطلسی ۱۵=۳×۵ دلار هزینه می‌کند

    For the sweet potato vines, she will spend 2 vines x $2.50/vine = $5.00

    او برای گل‌های سیب‌زمینی شیری، ۵=۵/۲×۲ دلار هزینه می‌کند

    Altogether, she will spend $15.00 + $5.00 = $20.00

    پس کاترین سرجمع باید ۲۰=۵+۱۵ دلار هزینه کند

    Method: 6B Fine-tuning

    She wants to add 3 petunias and 2 sweet potato vines to each basket so that’s 3+2 = 5 plants

    کاترین در هر سبد ۳ گل اطلسی و ۲ گل سیب‌زمینی شیرین قرار می‌دهد که جمعاً ۵=۳×۲ گل هستند

    The petunias cost $3.00 each so she will spend 3*5 = $15.00 on petunias

    قیمت هر گل اطلسی ۳ دلار است، پس ۱۵=۳×۵ دلار برای گل‌های اطلسی باید هزینه کند

    The sweet potato vines cost $2.50 each so she will spend 2.5*5 = $12.50 on sweet potato vines

    قیمت هر گل سیب‌زمینی شیرین ۵/۲ دلار است، پس ۵/۱۲=۵×۵/۲ دلار برای این گل‌ها هزینه می‌کند

    All total, she will spend 15+12.50 = $27.50 filling all 5 baskets

    در کل، ۵۰/۲۷=۵/۱۲+۱۵ دلار برای هر ۵ سبد هزینه پرداخت کند

     

    مسئله‌ ریاضی هفتم

    دبرا یک روز را به تماشای یک کندو می‌نشیند، تا ببیند چند زنبور از آن خارج و به آن وارد می‌شوند. در ۶ ساعت اول، دبرا ۳۰ زنبور را می‌بیند که از کندو خارج می‌شوند؛ یک دوم آن‌ها طی ۶ ساعت بعدی به کندو بر می‌گردند. در شش ساعت بعدی، دو برابر تعداد زنبورهایی که اولین بار کندو را ترک کردند، از کندو خارج می‌شوند و به آن بر می‌گردند. در شش ساعت آخر، همه‌ زنبورهایی که قبلاً از کندو خارج شده بودند، اما به آن برنگشته بودند نیز به آن بر می‌گردند. در ۶ ساعت آخر، دبرا چند زنبور را دیده که به کندو برگشته‌اند؟
    Method: 175B Verification

    Debra saw 30 bees leave the hive in the first 6 hours and then 1/2 that many bees return in the next 6 hours, 30 / 2 = 15 bees return to the hive in the next 6 hours.

    دبرا در ۶ ساعت اول ۳۰ زنبور را دیده که از کندو خارج شده‌اند و ۲/۱ آن‌ها در ۶ ساعت بعدی برگشته‌اند. پس ۱۵=۲÷۳۰ زنبور به کندو برگشته‌اند.

    She saw 30 bees leave the hive and then 15 bees return to the hive, 30 – ۱۵ = ۱۵ bees still haven’t returned to the hive.

    او دیده است ۳۰ زنبور کندو را ترک کرده و ۱۵ تا به آن برگشته‌اند، پس ۱۵=۱۵-۳۰ زنبور هنوز به کندو برنگشته‌اند

    Two times as many bees as she saw first leave the hive fly from the hive and leave in the next 6 hours, 2 * 30 = 60 bees leave the hive in the next 6 hours.

    در شش ساعت بعدی، دو برابر آن‌چه دفعه اول دیده بود از کندو خارج می‌شوند. پس ۶۰=۳۰×۲ زنبور در این بازه‌ زمانی از کندو خارج شده‌اند

    In total she saw 30 bees leave the hive and 15 bees return, 30 + 15 = 45 bees.

    در کل، ۳۰ زنبور کندو را ترک کرده و ۱۵ زنبور به آن برگشته‌اند؛ پس ۴۵=۱۵+۳۰.

    After the bees that hadn’t already returned did so, there were still 15 bees missing from the hive, so the total number of bees Debra saw return to the hive is 45 + 15 = 60 bees.

    بعد از اینکه آن تعداد زنبوری که به کندو برنگشته بودند نیز به آن برگشتند، ۱۵ زنبور همچنان بیرون از کندو باقی می‌مانند. پس در کل، تعداد زنبورهایی که دبرا در حال بازگشت به کندو دیده برابر است با ۶۰=۱۵+۴۰

    Method: 175B Fine-tuning

    Debra sees 30 bees leave the hive in the first 6 hours.

    دبرا در ۶ ساعت اول ۳۰ زنبور را دیده که از کندو خارج می‌شوند

    She sees 1/2 * 30 bees = 15 bees return to the hive in the next 6 hours.

    او ۱۵=۲/۱÷۳۰ زنبور را می‌بیند که در شش ساعت بعدی به کندو بر می‌گردند

    She sees 2 * 15 bees = 30 bees fly from the hive and leave in the next 6 hours.

    در شش ساعت بعدی، دبرا ۳۰=۱۵×۲ زنبور را می‌بیند که از کندو خارج می‌شوند

    Before the last 6 hours, Debra saw 30 + 15 + 30 = 75 bees leave the hive.

    قبل از ۶ ساعت آخر، ۷۵=۳۰+۱۵+۳۰ زنبور از کندو خارج شده‌اند

    Before the last 6 hours, Debra saw 75 – ۳۰ = ۴۵ bees return to the hive.

    قبل از شش ساعت آخر، دبرا ۴۵=۳۰-۷۵ زنبور به کندو بر می‌گردند

    Method: 6B Verification

    First find the total number of bees that left the hive: 30 bees * 6 hours = 180 bees

    اول تعداد کل زنبورهایی را که از کندو خارج شده‌اند، حساب می‌کنیم که می‌شود ۱۸۰=۶×۳۰

    Then subtract the number of bees that left in the first 6 hours from the number that returned: 180 bees – ۳۰ bees = 150 bees

    سپس تعداد زنبورهایی را که در ۶ ساعت اول به کندو برگشته‌اند، از تعداد زنبورهایی که از آن خارج شده‌اند کم می‌کنیم: ۱۵۰=۳۰-۱۸۰

    Then multiply that number by two to find the number of bees that returned: 150 bees * 2 = 300 bees

    سپس تعداد را در دو ضرب می‌کنیم، تا تعداد زنبورهایی را که برگشته‌اند، پیدا کنیم: ۳۰۰=۲×۱۵۰

    Method: 6B Fine-tuning

    Debra saw 30 bees leave the hive in the first 6 hours, 1/2 that number in the next 6 hours, and then 2*that number in the next 6 hours.

    دبرا در شش ساعت اول، ۳۰ زنبور را در حال ترک کندو دیده است که در شش ساعت بعدی ۲/۱ و در شش ساعت سوم، ۲ برابر آن را می‌بیند

    The total number of bees that left the hive in the last 6 hours is 30+1/2 that number+2*that number = 33.0

    تعداد کل زنبورهایی که در ۶ ساعت آخر کندو را ترک کرده‌اند، ۳۳=(۲)۳۰+(۲/۱)۳۰+۳۰ است

    She saw two times as many bees as she saw first leave the hive fly from the hive and leave in the next 6 hours, 33*2 = 66 bees

    دو برابر این تعداد کندو را ترک کرده و در ۶ ساعت بعدی به آن بر می‌گردند، پس: ۶۶=۲×۳۳

    The total number of bees that left the hive and returned in the next 6 hours is 66+33 = 99 bees

    تعداد کل زنبورهایی که کندو را ترک کرده و در شش ساعت بعدی به آن برگشته‌اند، برابر است با ۹۹=۳۳+۶۶

     

    مسئله‌ ریاضی هشتم

    حجم کمد تیموتی ۲۴ اینچ مکعب است. اندازه‌ کمد زک نصف اندازه‌ کمد تیموتی است و کمد پیتر یک چهارم اندازه‌ کمد زک است. کمد پیتر چند اینچ مکعب است؟
    Method: 175B Verification

    If Zack’s locker is half the size of Timothy’s locker, then it is 24 / 2 = 12 cubic inches.

    اگر کمد زک نصف کمد تیموتی باشد، اندازه‌اش ۱۲=۲÷۲۴ اینچ مکعب خواهد بود

    If Peter’s locker is 1/4 the size of Zack’s locker, then it is 12 / 4 = 3 cubic inches.

    اگر کمد پیتر ۴/۱ اندازه‌ کمد زک باشد، ۳=۴÷۱۲ اینچ مکعب خواهد بود

    Method: 175B Fine-tuning

    Zack’s locker is 24/2=12 cubic inches.

    کمد زک ۱۲=۲÷۲۴ اینچ مکعب است

    Peter’s locker is 12/4=3 cubic inches.

    اندازه‌ کمد پیتر ۳=۴÷۱۲ اینچ مکعب است

    Method: 6B Verification

    Zack’s locker is 24/2 = 12.0 cubic inches.

    کمد زک ۱۲=۲×۲۴ اینچ مکعب است

    Peter’s is 12/4 = 3.0 cubic inches.

    اندازه‌ کمد پیتر ۳=۴÷۱۲ اینچ مکعب است

    Method: 6B Fine-tuning

    Zack’s locker is 24/2 = 12 cubic inches.

    اندزه‌ کمد زک ۱۲=۲÷۲۴ اینچ مکعب است

    Peter’s locker is 12/4 = 3 cubic inches.

    اندازه‌ کمد پیتر ۳=۴÷۱۲ اینچ مکعب است

     

    مسئله‌ ریاضی نهم

    آملیا، مگان و دیور، کارهای خانه را تقسیم کردند، به نحوی که هر موقع دو نفر سر کار بودند، نفر سوم مشغول انجام این کارها باشد. کار آملیا زدن چمن‌ها بود که ۴ ساعت طول می‌کشید. مگان مسئول بیرون بردن سگ بود که ۲ ساعت بیشتر از کار آملیا طول می‌کشید. کار دیور هم شستن لباس‌ها بود که ۴ ساعت بیشتر از کار آملیا طول می‌کشید. کل زمانی را که هر سه نفر به انجام کارهای خانه اختصاص داده‌اند، محاسبه کنید.
    Method: 175B Verification

    Amalia’s chore was to mow the lawn, which took her 4 hours.

    کار آملیا، زدن چمن‌های باغچه بوده است که  ۴ ساعت طول کشیده است

    Megan’s chore was to walk the dog, which took 2 hours longer than Amalia’s work, so she took 4+2 = 6 hours to do her chore.

    کار مگان بیرون بردن سگ بوده که ۲ ساعت بیشتر از کار آملیا طول می‌کشد، یعنی ۶=۴+۲ ساعت

    Dior’s chore was to do laundry, which took 6 hours longer than Amalia’s work, so 6+4 = 10 hours for her to complete her chore.

    کار دیور شستن لباس‌ها بوده است که ۶ ساعت بیشتر از کار آملیا طول می‌کشد، یعنی ۱۰=۴+۶ ساعت

    The total time they all took doing their chores is 4+6+10 = 20 hours

    کل زمانی که این سه نفر صرف انجام کارهایشان کرده‌اند برابر است با ۲۰=۱۰+۶+۴ ساعت

    Method: 175B Fine-tuning

    Amalia took 4 hours to mow the lawn.

    آملیا ۴ ساعت صرف زدن چمن‌ها می‌کند

    Megan took 2 hours longer to walk the dog than Amalia, so 4 + 2 = 6 hours.

    مگان ۲ ساعت بیشتر از کار آملیا صرف بیرون بردن سگ می‌کند، یعنی ۶=۲+۴ ساعت

    Dior took well over 4 hours to do the laundry, meaning she took 4 + 6 = 10 hours.

    دیور ۴ ساعت بیشتر از این برای شستن لباس‌ها صرف می‌کند، یعنی ۱۰=۶+۴ ساعت

    Altogether, they took 4 + 6 + 10 = 20 hours to do their chores.

    پس این سه نفر در مجموع ۲۰=۱۰+۶+۴ ساعت صرف کارهایشان کرده‌اند

    Method: 6B Verification

    If Megan’s chore took 2 hours longer than Amalia’s, then it took 4+2 = 6 hours to complete.

    اگر کار مگان ۲ ساعت بیشتر از کار آملیا طول کشیده باشد، یعنی ۶=۲+۴ ساعت صرف کارش کرده است

    If Dior’s chore took 4 hours longer than Amalia’s, then it took 6+4 = 10 hours to complete.

    اگر کار دیور ۴ ساعت بیشتر از کار آملیا طول کشیده باشد، یعنی ۱۰=۶+۴ ساعت زمان برده است

    If you add the time they all took to complete their chores, then you get 4+6+10 = 20 hours.

    اگر تمام این ساعت‌ها را با هم جمع‌ کنیم، ۲۰=۱۰+۴+۶ ساعت می‌شود

    Method: 6B Fine-tuning

    If you add the time Amalia took to mow the lawn, it becomes 4+2 = 6 hours.

    اگر کار آملیا را جمع کنیم، ۶=۲+۴ ساعت می‌شود

    If Megan’s work on the dog took 2 hours longer than Amalia’s, the total time it took to walk the dog was 6+2 = 8 hours.

    اگر کار مگان را که ۲ ساعت بیشتر از کار آملیا طول می‌کشد، حساب کنیم، کل زمانی که باید صرف بیرون بردن سگ شود ۸=۶+۲ ساعت است

    If Dior’s work on laundry took well over 4 hours longer than Amalia’s, the total time it took to do laundry was 4+2 = 6 hours.

    اگر کار دیور ۴ ساعت بیشتر از کار آملیا طول بکشد، شستن لباس‌ها ۶=۴+۲ ساعت زمان می‌برد

    Together, the three took 6+8+6 = 20 hours doing chores.

    پس در کل، انجام تمامی کارهای خانه ۲۰=۶+۸+۶ ساعت طول می‌کشد

     

    مسئله‌ ریاضی دهم

    جان در هر نیم ساعت یک بطری آب می‌نوشد. حل هر جدول سودوکوی معمولی ۴۵ دقیقه از او زمان می‌برد. حل جدول سودوکوی سخت ۴ برابر این مقدار به زمان نیاز دارد. جان در این زمان، چند بطری آب می‌‌نوشد؟
    Method: 175B Verification

    He drinks 1/2 hour so 60 minutes / 2 = 30 minutes

    جان در هر نیم ساعت، یک بطری آب می‌نوشد و هر یک ساعت، دو تا سی دقیقه دارد

    A normal puzzle takes 45 minutes so an Extreme puzzle takes 45*4 = 180 minutes

    حل یک جدول معمولی ۴۵ دقیقه زمان می‌برد، پس حل جدول سودوکوی سخت به ۱۸۰=۴×۴۵ دقیقه زمان نیاز دارد

    That means he drinks 180/30 = 6 bottles of water

    پس جان در این زمان ۶=۳۰÷۱۸۰ بطری آب می‌نوشد

    Method: 175B Fine-tuning

    A normal sudoku puzzle takes 45 minutes to solve so an extreme sudoku takes 4*45 = 180 minutes

    حل یک جدول سودوکوی ساده ۴۵ دقیقه زمان می‌برد، پس برای حل یک جدول ساخت به ۱۸۰=۴×۴۵ دقیقه زمان نیاز است

    He drinks a bottle of water every half hour and an extreme sudoku takes 180 minutes so he drinks 180/2 = 90 bottles of water

    جان هر نیم ساعت یک بطری آب می‌نوشد و از آن ‌جایی که حل یک جدول سودوکوی سخت ۱۸۰ دقیقه زمان می‌برد، ۹۰=۲×۱۸۰ بطری آب در این مدت لازم است

    Method: 6B Verification

    He drinks a bottle every 45 minutes so that’s 1/2*45=22.5 minutes

    جان هر ۴۵ دقیقه یک بطری آب می‌نوشد، پس یعنی ۵/۲۲=۲/۱÷۴۵ دقیقه

    An extreme sudoku takes 4*45=180 minutes

    یک جدول سودوکوی سخت به ۱۸۰=۴×۴۵ دقیقه زمان نیاز دارد

    So he drinks 180/22.5=8 bottles of water

    پس جان ۸=۵/۲۲÷۱۸۰ بطری آب نیاز دارد

    Method: 6B Fine-tuning

    He drinks 1.5 bottles of water per hour because 45 / 60 = 0.75

    جان در هر یک ساعت ۵/۱ بطری آب می‌نوشد، چون ۷۵/۰=۶۰÷۴۵

    That means he drinks 3 bottles of water because 0.75 x 2 = 1.5

    پس می‌توان گفت ۳ بطری آب نیاز دارد، چون ۵/۱=۲×۷۵/۰

    دیتاست GSM8K

    در دیتاست GSM8K، ۸۵۰۰ مسئله‌ ریاضی دبستان وجود دارد. راه‌حل هر کدام از آن‌ها بین ۲ تا ۸ گام نیاز دارد. راه‌حل‌ها شامل مجموعه‌ای از محاسبات متوالی ساده هستند که با استفاده از عملیات‌های پایه (+ – × ÷) اجرا می‌شوند. نوآورانه‌ترین مدل‌های زبانی که به دقت تنظیم شده باشند نیز عملکرد چندان خوبی روی این دیتاست از خود نشان نمی‌دهند؛ دلیل این امر می‌تواند گوناگونی بالای مسائل باشد. با این حال، راه‌حل‌های GSM8K مبتنی بر مفاهیم ابتدایی هستند و به همین دلیل، نتایج امیدوارکننده‌ای از خود نشان می‌دهند.

    راه‌حل‌های GSM8K به جای اینکه ساختار عبارات ریاضی را داشته باشند، به صورت زبان طبیعی نوشته شده‌اند. از آنجایی که این راه‌حل‌ها وابسته به زبان طبیعی هستند، تفسیرشان برای انسان‌ها راحت‌تر است.

    اعتبارسنج‌ها، مدل‌هایی که از اشتباه‌های خود درس می‌گیرند

    یکی از چالش‌های اساسی استدلال مربوط به ریاضی، حساسیت بالای تک‌تک اشتباه‌ها است. مدل‌های اتورگرسیو (خودرگرسیونی) که راه‌حل‌ها را توکن به توکن تولید می‌کنند، هیچ مکانیزمی برای تصحیح اشتباه‌هایشان ندارند. به عبارت دیگر، همان‌طور که در مثال‌های بالا مشاهده کردید، بخش‌هایی از راه‌حل که درست نیستند، به سرعت پنهان می‌شوند و دیگر قابل‌تشخیص نیستند.

    در این پروژه، محققان اعتبارسنج‌هایی را آموزش دادند، تا میزان درستی راه‌حل‌های مدل را ارزیابی کنند. این اعتبارسنج‌ها راه‌حل‌هایی را که به دست خود مدل نوشته شده‌اند، دریافت می‌کنند و سپس آموزش می‌بینند، تا درستی آن‌ها را تشخیص دهند.

    پژوهشگران برای حل هر مسئله‌ جدید آزمایشی، ۱۰۰ راه‌حل داوطلب تولید کردند و سپس از طریق اعتبارسنج، مناسب‌ترین راه‌حل (با بالاترین نمره) را انتخاب کردند. قابلیتی که به کمک اعتبارسنج‌ها می‌آید، ماهیت اختیاری آن‌هاست. به علاوه، اعتبارسنجی راه‌حل‌ها معمولاً آسان‌تر از تولید آن‌هاست.

    ریاضی

    یافته‌ها نشان دادند که استفاده از مدل اعتبارسنج، عملکرد مدل را به‌شدت ارتقا می‌دهد؛ البته تا زمانی که دیتاست به اندازه‌ کافی بزرگ و جامع باشد. در کار با دیتاست‌های کوچک، مدل‌های اعتبارسنج دچار مشکل بیش‌برازش می‌شوند، چون به جای یادگیری خواص اصلی استدلال ریاضی، صرفاً پاسخ‌های نهایی دیتاست آموزشی را حفظ می‌کنند.

    وقتی از کل دیتاست آموزشی استفاده می‌شود، مدل اعتبارسنج پارامتر ۶B عملکرد نسبتاً بهتری از مدل پارامتر ۱۷۵B (که به دقت تنظیم شده) از خود نشان می‌دهد. این تفاوت، تقریباً برابر با ارتقای عملکردی است که در صورت افزایش ۳۰ برابری اندازه‌ مدل به دست می‌آید. علاوه بر این، به نظر می‌رسد با بسط داده‌ها، مدل اعتبارسنج به نتایج بهتری هم دست یابد.

    جمع‌بندی

    ارائه‌ استدلال‌های درست و تشخیص اشتباه‌ها از جمله چالش‌های کلیدی هستند که توسعه‌ هوش مصنوعی عمومی را با مانع روبه‌رو می‌کنند. مسائل ریاضی دبستان بستر ایده‌آلی برای به آزمایش گذاشتن این قابلیت‌ها به شمار می‌روند. مشکلات GSM8K از نظر مفهومی ساده هستند؛ اما در این نوع مسائل، یک اشتباه کوچک کافی است، تا کل راه‌حل از مسیر درست خارج شود. تشخیص و اجتناب از اشتباه‌هایی از این دست، مهارتی حیاتی برای مدل‌ها به شمار می‌رود. با آموزش اعتبارسنج‌ها می‌توان به مدل‌ها آموخت، تا بین راه‌حل‌های خوب و راه‌حل‌هایی که به جواب نمی‌رسند، تمیز قائل شوند. به نظر می‌رسد با پیاده‌سازی مدل‌ها در حوزه‌هایی که از نظر منطقی پیچیده‌تر هستند، می‌توان این مهارت‌ها را توسعه بخشید.

    انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۲ میانگین: ۳]

    هوش مصنوعی، تلفات جاده‌ای را تا ۷۷ درصد کاهش داد

    مقاله قبلی

    صنایع پررونق برای متخصصان رباتیک را بشناسید

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد.