กลุ่ม SCBX เปิดเวที “Typhoon Hackathon 2024” เฟ้นหาสุดยอดทีมนักพัฒนาแอปพลิเคชันต่อยอดจากโมเดลภาษาไทยขนาดใหญ่ “ไต้ฝุ่น” พร้อมร่วมผลักดันศักยภาพด้าน AI ของประเทศไทย

  • มุ่งเพิ่มโอกาสให้คนไทยเข้าถึงและใช้ประโยชน์จากเทคโนโลยี AI ได้อย่างเท่าเทียมและมีประสิทธิภาพ


          กลุ่ม SCBX นำโดย เอสซีบี เอกซ์ (SCBX) และ เอสซีบี เท็นเอกซ์ (SCB 10X) เดินหน้าผลักดันระบบนิเวศและคอมมูนิตี้ด้าน AI ในประเทศไทย พร้อมปลดล็อกศักยภาพด้านโมเดลภาษาไทยขนาดใหญ่ ผ่านการจัดงาน “Typhoon Hackathon 2024 ภายใต้แนวคิด "Empowering Thai Language AI for Inclusivity" เฟ้นหาสุดยอดทีมนักพัฒนาแอปพลิเคชันและโซลูชันด้าน AI ที่เหมาะสมกับบริบทของสังคมและวัฒนธรรมไทย โดยนำ "ไต้ฝุ่น (Typhoon)” โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะมาประยุกต์ใช้ โดยทีมผู้ผ่านเข้ารอบมีโอกาสที่จะนำเสนอไอเดีย รวมถึงโอกาสร่วมงานกับพันธมิตรและนักลงทุนด้าน AI ชั้นนำระดับโลก อาทิ Microsoft, AI Singapore, SCBX, SCB 10X, DataX, VISTEC, VISAI และ Gowajee เป็นต้น ชิงรางวัลมูลค่ารวมกว่า 180,000 บาท สำหรับผู้ที่สนใจสามารถสมัครเข้าร่วมแข่งขันได้ที่  https://forms.gle/ZRtqoRitc97Ddcdh9 ตั้งแต่ วันนี้ – 9 มิถุนายน 2567 โดยกิจกรรมจะจัดขึ้นในวันที่ 28-30 มิถุนายน 2567 ณ DISTRICTX อาคาร FYI Center 


          นายกวีวุฒิ เต็มภูวภัทร Head of R&D and Innovation Lab บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) หรือ SCBX กล่าวว่า “ในภูมิทัศน์สมัยใหม่ของ AI โมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ได้กลายเป็นเครื่องมืออันทรงพลังที่มีศักยภาพในการเปลี่ยนแปลงด้านต่างๆ อย่างไรก็ตาม โมเดลภาษาขนาดใหญ่ส่วนมากในปัจจุบันถูกฝึกฝนด้วยภาษาอังกฤษเป็นหลัก ในขณะที่ภาษาไทย และภาษาอื่นๆ ในภูมิภาคเอเชียตะวันออกเฉียงใต้มีข้อมูลและทรัพยากรสำหรับการพัฒนาโมเดลที่จำกัด (Low Resource Language) ซึ่งทำให้เกิดปัญหาช่องว่างทางภาษา และส่งผลให้ประสิทธิภาพการใช้งานและการพัฒนาต่อยอดทำได้ไม่ดีเท่าที่ควรเมื่อเทียบกับโมเดลภาษาอังกฤษ ด้วยเหตุนี้ กลุ่ม SCBX นำโดย SCBX และ SCB 10X พร้อมพันธมิตรชั้นนำระดับโลก ร่วมกันขับเคลื่อนส่งเสริมและผลักดันการพัฒนานวัตกรรมด้าน AI ที่ยั่งยืนในประเทศไทย ผ่านการจัดงาน “Typhoon Hackathon 2024 ด้วยความมุ่งมั่นในการนำเทคโนโลยี AI มาประยุกต์ใช้เพื่อพัฒนานวัตกรรมและโซลูชันด้านโมเดลภาษาขนาดใหญ่ โดยเฉพาะภาษาไทย ที่ถูกพัฒนาขึ้นให้เหมาะสมกับบริบทของสังคมและวัฒนธรรมไทย เข้าใจความต้องการของคนไทยโดยเฉพาะ ตอกย้ำความมุ่งมั่นของกลุ่ม SCBX ในการมุ่งสู่เป้าหมายการเป็น AI-First Organization อย่างแท้จริง” 


          ด้าน นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า “SCB 10X ได้ริเริ่มพัฒนา “ไต้ฝุ่น” (Typhoon) โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ที่เข้าใจบริบทภาษาไทย ซึ่งมีประสิทธิภาพเหนือกว่าทุกโมเดลภาษาไทยที่ปล่อยฟรีและมีคะแนนเทียบเท่ากับ GPT-3.5 โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย กลุ่ม SCBX เล็งเห็นประโยชน์ที่จะนำโมเดล “ไต้ฝุ่น” ไปพัฒนาต่อยอดให้เกิดนวัตกรรมและโซลูชันด้าน Generative AI ในอนาคต เราจึงจัดกิจกรรม Hackathon ในครั้งนี้เพื่อเปิดโอกาสให้นักพัฒนา ผู้สร้าง และผู้ประกอบการที่สนใจ เข้าร่วมพัฒนาโซลูชันด้าน Generative AI ในระดับแอปพลิเคชัน โดยต่อยอดจากการนำโมเดล “ไต้ฝุ่น” ในรูปแบบของ Typhoon API ไปประยุกต์ใช้ภายใต้โจทย์ “Empowering Thai Language AI for Inclusivity” โดยตัวอย่างขอบเขตของแอปพลิเคชัน  ได้แก่ 1. Thai Culture-Specific Applications: แอปพลิเคชันที่ถูกออกแบบให้เหมาะกับวัฒนธรรมไทย เช่น แอปพลิเคชันแนะนำร้านอาหารสตรีทฟู้ด 2. Productivity Tools: เครื่องมือเพิ่มประสิทธิภาพการทำงานสำหรับภาษาไทย เช่น เครื่องมือถอดความและสรุปความภาษาไทย 3. Content Generation: แพลตฟอร์ม AI สำหรับสร้างเนื้อหาทางการตลาดเป็นภาษาไทยตั้งแต่สโลแกนไปจนถึงโพสต์บนโซเชียลมีเดีย 4. Creative Writing Assistance: ผู้ช่วยด้านการเขียนเชิงสร้างสรรค์ที่นำเสนอบริบทภาษาที่เหมาะสมกับความต้องการของนักเขียนไทย และ 5. Thai Education: โซลูชันเพื่อยกระดับการศึกษาไทยด้วยเทคโนโลยี AI เพื่อให้การเรียนรู้และเข้าถึงได้ทุกเพศทุกวัย ส่งเสริมวัฒนธรรมการเรียนรู้อย่างต่อเนื่อง โดยเราหวังเป็นอย่างยิ่งว่าการแข่งขันในครั้งนี้จะนำ “ไต้ฝุ่น” โมเดลภาษาไทยไปประยุกต์ใช้ให้เกิดโซลูชันระดับแอปพลิเคชันที่เพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทยในอนาคต”

 

          สำหรับผู้ที่สนใจสามารถสมัครเข้าร่วมแข่งขันได้ที่ https://forms.gle/ZRtqoRitc97Ddcdh9 ตั้งแต่ วันนี้ – 9 มิถุนายน 2567 หรือ สนใจสอบถามรายละเอียดเพิ่มเติมได้ที่ Typhoon Hackathon Discord: https://discord.com/channels/1200273121614241863/1240623610842845216 

 

 

เกี่ยวกับบริษัท เอสซีบี เอกซ์ จำกัด (มหาชน)

SCBX เป็นยานแม่ของกลุ่มธุรกิจเทคโนโลยีทางการเงิน โดยมี 12 บริษัทภายใต้กลุ่มฯ ครอบคลุม 3 กลุ่มธุรกิจสำคัญ ได้แก่ ธุรกิจธนาคาร (Banking Business) ธุรกิจบริการทางการเงินดิจิทัลและสินเชื่อเพื่อรายย่อย (Consumer and Digital Finance Business) ธุรกิจแพลตฟอร์มและเทคโนโลยี (Platform and Technology Business) รวมถึง Climate Technology มุ่งขับเคลื่อนยุทธศาสตร์สู่การเป็นกลุ่มเทคโนโลยีทางการเงินระดับภูมิภาคที่น่าชื่นชม ดำเนินธุรกิจด้วยความคล่องตัว รอบคอบในการกำกับดูแลและบริหารความเสี่ยง ตลอดจนมีขีดความสามารถและศักยภาพในการแข่งขันกับคู่แข่งระดับโลกได้อย่างทัดเทียม

 

เกี่ยวกับบริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X)

บริษัท เอสซีบี เท็นเอกซ์ จำกัด เป็นบริษัท ในกลุ่มเอสซีบี เอกซ์ ก่อตั้งเมื่อเดือนมกราคม พ.ศ. 2563 ภายใต้ภารกิจ “Moonshot Mission” มุ่งเน้นด้านเทคโนโลยี นวัตกรรม และการลงทุนที่สามารถสร้างการเติบโตแบบก้าวกระโดด เรามุ่งเน้นการลงทุนในกลุ่มธุรกิจด้าน Disruptive Technology: บล็อกเชน, Digital Assets, Web3 และ Deep Tech

ศึกษารายละเอียดเพิ่มเติมได้ที่ : https://scb10x.com/

  

เกี่ยวกับไต้ฝุ่นโมเดล (Typhoon Thai LLM)

“ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งนับเป็นโมเดลภาษาไทยขนาดใหญ่ที่ดีที่สุดในปัจจุบันและมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย โดย “ไต้ฝุ่น” (Typhoon) ถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language) โดยปัจจุบัน “ไต้ฝุ่น” (Typhoon) ถูกออกแบบและพัฒนาขึ้นมาแล้วทั้งหมด 2 เวอร์ชัน ได้แก่ 1. Typhoon-1 ที่พัฒนาต่อยอดมาจากโมเดล Open Source ชื่อ Mistral-7B และ 2. Typhoon-1.5 ที่พัฒนาต่อยอดมาจากโมเดล Open Source ชื่อ Llama3-8B และ Qwen-72B โดยในแต่ละเวอร์ชัน จะมีโมเดล 2 ประเภท ได้แก่ 1.Pretrained Model ซึ่งเปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก 2.Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น

 

ผู้สนใจและนักพัฒนาทดลองสามารถดาวน์โหลด Typhoon Pretrained Model ภายใต้ใบอนุญาต Apache 2.0 ทั้งสองเวอร์ชันได้ที่ https://huggingface.co/scb10x/ และสามารถทดลองใช้ Typhoon Instruction-tuned Model เวอร์ชันล่าสุดผ่าน Typhoon API ได้ที่ https://opentyphoon.ai/