در هفدهم ، خبرنگار از کنفرانس توسعه امنیت داده های 2025 آموخت که کشور من تعدادی از شرکتهای بالادست و پایین دست را در زنجیره صنعت فاکتور داده ها پرورش و گسترش می دهد. تخمین زده می شود که تا سال 2030 ، مقیاس صنعت داده های کشور من به 7.5 تریلیون یوان خواهد رسید.
به اشتراک گذاری باز از داده های عمومی
"داده های خواب" عظیم را فعال کنید
به عنوان اولین کشور جهان که داده ها را در عوامل تولید قرار می دهد ، کشور من در ابتدا زنجیره ای کامل از صنعت داده ها را ایجاد کرده است. داده ها نشان می دهد که تولید سالانه داده های کشور من در سال 2024 به 41.06 ZET Bytes رسیده است که نسبت به سال گذشته 25 ٪ افزایش یافته است.
از هم اکنون ، بیش از 190،000 شرکت مرتبط در زمینه داده در کشور من وجود دارد و مقیاس صنعت داده از 2 تریلیون یوان فراتر می رود. بر اساس نرخ رشد سالانه بیش از 20 ٪ ، مقیاس صنعت داده های کشور من در سال 2030 به 7.5 تریلیون یوان می رسد.
alt = ""/>
مدیر ملی داده های ملی لیو لیونگ: در حال حاضر ، ما قصد داریم یک سیستم زیرساخت داده های هماهنگ ، به صورت عمودی متصل و هماهنگ ایجاد کنیم و اساساً ساختار اصلی زیرساخت داده های ملی را تا سال 2029 بسازیم. src = "http://www.china-news-online.com/pic/2025-05-18/pudzsghxmjk.jpg" alt = "" //
به اشتراک گذاری باز داده های عمومی به یک پیشرفت مهم در بازار سازی عناصر داده تبدیل شده است. در سال 2024 ، تعداد سکوهای باز داده های عمومی محلی در سطح شهرداری در سراسر کشور 7.5 ٪ افزایش یافته است ، تعداد داده های باز 7.1 ٪ افزایش یافته است و تعداد مجموعه داده های با کیفیت بالا نسبت به سال گذشته 27.4 ٪ افزایش یافته است.
از نظر ادغام عناصر و صنایع داده ، این کشور در حال تسریع در موانع باز کردن برای به اشتراک گذاری داده های عمومی ، ترویج ادغام عمیق داده های عمومی و داده های سازمانی و فعال کردن "داده های خواب" گسترده است.
ساخت مجموعه داده های با کیفیت بالا
پیشرفت هوش مصنوعی را تسریع کنید
در حال حاضر ، داده ها از عوامل تولید سنتی فراتر رفته و به نیروی محرک اصلی برای دستیابی به موفقیت در فناوری اطلاعات مصنوعی و تحول صنعتی تبدیل شده است. مجموعه داده های با کیفیت بالا نه تنها سنگ بنای جهش در عملکرد مدل هوش مصنوعی بلکه تغییر شکل کل زنجیره صنعتی از تحقیقات و توسعه فناوری تا اجرای تجاری را نیز تغییر می دهد. بنابراین مجموعه داده های با کیفیت بالا چگونه ساخته می شود؟
در ونژو ، ژجیانگ ، به عنوان "زمینه تست" برای اصلاح ملی بازار محور عناصر داده ، یک سیستم امنیت و انطباق داده ها در اینجا ساخته شده است تا از جریان گسترده عناصر داده اطمینان حاصل شود ، یک اکوسیستم تجارت داده را تشکیل می دهد و داده های بیشتری را "زنده" می کند.
pe> master stoxt insteneration ، pe stoxt text incial از ادبیات ، کتاب ها ، مقالات ، گزارش های تحقیقاتی ، استفاده شده است. در آینده هنوز چیزهای غیر متنی بیشتری مانند تصاویر ، فیلم ها و سنسورهای مختلف مورد نیاز است. این داده ها همچنین منبع مهمی از یادگیری مدل در مقیاس بزرگ هستند.
حاشیه نویسی و تمیز کردن داده ها پیوندهای کلیدی در ساخت مجموعه داده های با کیفیت بالا هستند.
حاشیه نویسی داده به هوش مصنوعی می آموزد که "جهان را بشناسد" از طریق "برچسب زدن". داده های بدون برچسب مانند کتابهای درسی گنجانیده شده است و در نتیجه هوش مصنوعی قادر به یادگیری مؤثر نیست ؛
>
eseginate instent instent سناریوی کافی و از لحاظ حرفه ای مشخص شده است که مدل هوش مصنوعی می تواند از طریق "دقت آزمایشگاهی" شکسته شود ، واقعاً توانایی اجرای صنایع را دارد و توسعه اقتصاد دیجیتال را هدایت می کند.
ارزش خروجی صنعت برچسب زدن به داده های کشور من از 8 میلیارد یوان فراتر می رود
"گزارش تحقیق مجموعه داده های با کیفیت بالا" که در کنفرانس توسعه امنیت داده های 2025 منتشر شده است ، نشان می دهد که با تکرار هوش مصنوعی و فناوری مدل با مقیاس بزرگ ، ارزش خروجی داده های من در صنعت من از طریق لیبل داده های من از 800 yuan فراتر رفته است. توسعه در مقیاس بزرگ و استاندارد.
در سال 2024 ، تعداد شرکت هایی که در حال توسعه یا استفاده از هوش مصنوعی در کشور من هستند 36 ٪ نسبت به سال گذشته افزایش یافته است ، و تعداد مجموعه داده های با کیفیت بالا نسبت به سال گذشته 27.4 ٪ افزایش یافته است ، و به شدت از آموزش اطلاعات و کاربردهای هوش مصنوعی حمایت می کند. شرکت های فناوری داده با استفاده از مدل های بزرگ و شرکت های کاربردی داده ها به ترتیب 57.21 ٪ و 37.14 ٪ نسبت به سال گذشته افزایش یافته اند.
liu wenqiang ، معاون رئیس جمهور. به صدها میلیارد سطح رسید. ترویج ساخت هفت پایگاه برچسب زدن به داده در سراسر کشور ، ساخت 335 مجموعه داده با کیفیت بالا در زمینه های مراقبت های پزشکی ، صنعت ، آموزش و غیره ، با مقیاس کلی مارک 1.7 تریلیون سل ، پشتیبانی از تحقیق و توسعه 121 مدل بزرگ داخلی.
این گزارش نشان می دهد که کشور من در حال حاضر در حال تسریع در نوآوری و توسعه مجموعه داده های با کیفیت بالا است ، اما هنوز هم با مشکلاتی مانند سهام داده های کوچک و خروجی های پایین ، کیفیت ناهموار مجموعه داده ها ، عدم وجود راهنمای اصلی داده های با ارزش بالا و راندمان استفاده از داده ها روبرو است.
job interty jove job ، eseense jove jove ، eseense job ، esegine job ، esegine jove jove jove jove jove job ، eseense job jove jove jove jove jove job ، esegine job jove jove jove jove jove jove jove. از قابلیت اطمینان و یکپارچگی منابع داده اطمینان حاصل کنید. تضمین های حریم خصوصی و امنیت داده ها را تقویت و ترویج ساخت داده های ارزیابی امنیتی مجموعه داده ها.
(خبرنگاران CCTV Wang Shiyu ، Zhang Wei ، Tang Zhijian ، Zhang Yan ، Han Dong)