Modern technology gives us many things.

Тесты новейшего процессора Loongson 3A6000

146

Время на прочтение 13 мин Количество просмотров 8.1K Высокая производительность *Процессоры Обзор

Тесты новейшего процессора Loongson 3A6000

Сравнение процессоров Loongson 3A5000 и 3A6000

Недавно был представлен 8-ядерный процессор следующего Loongson 3A6000 на базе ядра LA664, а знакомый энтузиаст смог приобрести плату на данном процессоре (модель процессора LS3A6000-HV и чипсет LS7A2000).

Тесты новейшего процессора Loongson 3A6000

Материнская плата с процессором Loongson LA6000-HV и чипсетом LS7A2000

Тесты новейшего процессора Loongson 3A6000

BIOS Setup Utility — System Summary

Тесты новейшего процессора Loongson 3A6000

BIOS Setup Utility — System Summary

Раннее я проводил тесты десктопного процессора Loongson 3A5000, поэтому его будем сравнивать с процессором Loongson 3A6000 (модель LS3A6000-HV). Дополнительно сравним с процессором Intel Core-i5 10500T.

Характеристики процессоров Loongson 3A5000 и Loongson 3A6000:

 

Loongson 3A5000

Loongson 3A6000 HV

Intel Core-i5 10500T

Семейство ISA

RISC

RISC

CISC

Архитектура

loongarch64

loongarch64

amd64

Микроархитектура

GS464V

LA664

Comet Lake

Частота (МГц)

2500

2500

2300 (3800)

Ядра

4

8 (8 ALU, 4 FPU)

6 (12)

Тех процесс (нм)

12

12

14

TDP (Вт)

35

80

35

Кеш

64 Кб L1I, 64 Кб L1D,

1 Мб L2 (0,25 x 4)

16 Мб L3

64 Кб L1I, 64 Кб L1D,

2 Мб L2 (0,25 x 8)

16 Мб L3

32 Кб L1I, 32 Кб L1D,

2 Мб L2 (0,25 x 6)

12 Мб L3

Тип ОЗУ

DDR4-3200

DDR4-3200

DDR4-2666

GFLOPs

160

320

300

Год

2021

2023

2020

Были проведены следующие тесты:

  • 7zip встроенный бенчмарк

  • Dhrystone, Whetsone

  • Coremark

  • Scimark 2

  • Mp MFLOPS

  • Stream

  • SPEC 2006 (1 поток)

Сразу переходим к результатам, но детали тестов смотрите далее.

Результаты

Тест

Loongson 3A5000

Loongson 3A6000-HV

Intel Core-i5 10500T

Dhrystone [DMIPS]

18563

21522

26033

Whetstone [MWIPS]

3990

4848

6860

Whetstone MP [MWIPS]

15001

34556

71132

Linpack 100 [MFLOPS]

2929

4057

8405

Scimark 2 [Composite score]

1487

2108

3241

Coremark (1T; MT)

14934; 58797

21278; 113416

31174; 188331

MP MFLOPS

121167

301765

373570

7zip (Comp; Decomp; Tot) (MT)

11360; 11638; 11081

21659; 20126; 20892

23475; 21253; 22364

STREAM (Copy; Scale; Add; Triad) [MB/s]

14593; 14641; 13276; 13719

31521; 31019; 31299; 31452

15495; 10806; 12408; 12408

SPEC 2006 INT

25

44

 

SPEC 2006 FP

26

54

 

 По результатам можно сделать вывод, что процессор Loongson 3A6000 в однопоточных тестах стал на 30% производительнее и не сильно отстаёт от Core-i5 10500-T.

Немного об архитектуре LoongArch

Loongson — процессор на основе сильно переработанной RISC архитектуре MIPS64, часть ненужных команд MIPS64 была удалена и добавлено большое число расширений (SIMD, шифрование, бинарная трансляция, виртуализация), всего порядка 2000+ инструкций.

lscpu 3A5000Architecture: loongarch64 Byte Order: Little Endian CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 1 Core(s) per socket: 4 Socket(s): 1 NUMA node(s): 1 Model name: Loongson-3A5000 CPU max MHz: 2500.0000 CPU min MHz: 225.0000 BogoMIPS: 4992.00 L1d cache: 64K L1i cache: 64K L2 cache: 256K L3 cache: 16384K NUMA node0 CPU(s): 0-3

lscpu 3A6000-HVprocessor : 0 package : 0 core : 0 global_id : 0 CPU Family : Loongson-64bit Model Name : Loongson-3A6000-HV CPU Revision : 0x00 FPU Revision : 0x00 CPU MHz : 2500.00 BogoMIPS : 5000.00 TLB Entries : 2112 Address Sizes : 48 bits physical, 48 bits virtual ISA : loongarch32 loongarch64 Features : cpucfg lam ual fpu lsx lasx crc32 lvz lbt_x86 lbt_arm lbt_mips Hardware Watchpoint : yes, iwatch count: 8, dwatch count: 4 … processor : 7 package : 0 core : 3 global_id : 7 CPU Family : Loongson-64bit Model Name : Loongson-3A6000-HV CPU Revision : 0x00 FPU Revision : 0x00 CPU MHz : 2500.00 BogoMIPS : 5000.00 TLB Entries : 2112 Address Sizes : 48 bits physical, 48 bits virtual ISA : loongarch32 loongarch64 Features : cpucfg lam ual fpu lsx lasx crc32 lvz lbt_x86 lbt_arm lbt_mips Hardware Watchpoint : yes, iwatch count: 8, dwatch count: 4

Dhrystone

Dhrystone достаточно древний тест 80х годов, написан на C. Тестирует целочисленную арифметику и работу со строками. Результаты измеряются в Dhrystone/s и DMIPS. (DMIPS = Dhrystone/s делить на 1757).

Вывод теста Dhrystone на 3A6000-HVDhrystone Benchmark, Version 2.1 (Language: C or C++) Optimisation loongarch64 loongarch64 optimized Register option not selected 10000 runs 0.00 seconds 100000 runs 0.00 seconds 1000000 runs 0.03 seconds 10000000 runs 0.26 seconds 20000000 runs 0.53 seconds 40000000 runs 1.06 seconds 80000000 runs 2.12 seconds Final values (* implementation-dependent): Int_Glob: O.K. 5 Bool_Glob: O.K. 1 Ch_1_Glob: O.K. A Ch_2_Glob: O.K. B Arr_1_Glob[8]: O.K. 7 Arr_2_Glob8/7: O.K. 80000010 Ptr_Glob-> Ptr_Comp: * 0x55555b0182a0 Discr: O.K. 0 Enum_Comp: O.K. 2 Int_Comp: O.K. 17 Str_Comp: O.K. DHRYSTONE PROGRAM, SOME STRING Next_Ptr_Glob-> Ptr_Comp: * 0x55555b0182a0 same as above Discr: O.K. 0 Enum_Comp: O.K. 1 Int_Comp: O.K. 18 Str_Comp: O.K. DHRYSTONE PROGRAM, SOME STRING Int_1_Loc: O.K. 5 Int_2_Loc: O.K. 13 Int_3_Loc: O.K. 7 Enum_Loc: O.K. 1 Str_1_Loc: O.K. DHRYSTONE PROGRAM, 1’ST STRING Str_2_Loc: O.K. DHRYSTONE PROGRAM, 2’ND STRING Nanoseconds one Dhrystone run: 26.45 Dhrystones per Second: 37803100 VAX MIPS rating = 21515.71

Вывод теста Dhrystone на 3A5000Dhrystone Benchmark, Version 2.1 (Language: C or C++) Optimisation loongarch64 loongarch64 optimized Register option not selected 10000 runs 0.00 seconds 100000 runs 0.00 seconds 1000000 runs 0.03 seconds 10000000 runs 0.31 seconds 20000000 runs 0.61 seconds 40000000 runs 1.23 seconds 80000000 runs 2.45 seconds Final values (* implementation-dependent): Int_Glob: O.K. 5 Bool_Glob: O.K. 1 Ch_1_Glob: O.K. A Ch_2_Glob: O.K. B Arr_1_Glob[8]: O.K. 7 Arr_2_Glob8/7: O.K. 80000010 Ptr_Glob-> Ptr_Comp: * 0x1239782a0 Discr: O.K. 0 Enum_Comp: O.K. 2 Int_Comp: O.K. 17 Str_Comp: O.K. DHRYSTONE PROGRAM, SOME STRING Next_Ptr_Glob-> Ptr_Comp: * 0x1239782a0 same as above Discr: O.K. 0 Enum_Comp: O.K. 1 Int_Comp: O.K. 18 Str_Comp: O.K. DHRYSTONE PROGRAM, SOME STRING Int_1_Loc: O.K. 5 Int_2_Loc: O.K. 13 Int_3_Loc: O.K. 7 Enum_Loc: O.K. 1 Str_1_Loc: O.K. DHRYSTONE PROGRAM, 1’ST STRING Str_2_Loc: O.K. DHRYSTONE PROGRAM, 2’ND STRING Nanoseconds one Dhrystone run: 30.66 Dhrystones per Second: 32616185 VAX MIPS rating = 18563.57

Whetstone

Тестирует арифметику с плавающей/фиксированной запятой, математические функции, ветвления, вызовов функций, присваиваний, работы с числами с фиксированной запятой, ветвлений. Результаты измеряются в MWIPS.

Вывод теста Whetstone на 3A6000-HV8 CPUs Available ############################################## Multithreading Single Precision Whetstones loongarch64 loongarch64 optimized Using 8 threads — Thu Nov 9 14:20:35 2023 Calibrate 0.00301 Seconds 1 Passes (x 100) 0.01406 Seconds 5 Passes (x 100) 0.06950 Seconds 25 Passes (x 100) 0.34647 Seconds 125 Passes (x 100) Use 3607 passes (x 100) MFLOPS 1 907 907 907 907 907 907 906 906 MFLOPS 2 907 907 907 907 907 907 907 907 IFMOPS 29892 29885 29877 29871 29856 29852 29840 29815 FIXPMOPS 2168 2168 2168 2168 2168 2167 2167 2167 COSMOPS 123 123 123 123 123 123 123 123 MFLOPS 3 662 661 661 661 661 661 661 661 EQUMOPS 1872 1871 1871 1871 1871 1871 1871 1869 EXPMOPS 91 91 91 91 91 91 91 91 millisec 8347 8348 8348 8348 8347 8348 8347 8348 MWIPS 4321 4321 4321 4321 4321 4321 4321 4321 MWIPS MFLOPS MFLOPS MFLOPS Cos Exp Fixpt If Equal Thread 1 2 3 MOPS MOPS MOPS MOPS MOPS 1 4321 907 907 662 123 91 2167 29877 1872 2 4321 907 907 661 123 91 2167 29892 1871 3 4321 906 907 661 123 91 2168 29885 1871 4 4321 907 907 661 123 91 2168 29871 1871 5 4321 907 907 661 123 91 2168 29852 1869 6 4321 906 907 661 123 91 2167 29856 1871 7 4321 907 907 661 123 91 2168 29840 1871 8 4321 907 907 661 123 91 2168 29815 1871 Total 34568 7253 7254 5291 986 732 17340 238888 14968 MWIPS 34557 Based on time for last thread to finish Results Of Calculations Thread 1 MFLOPS 1 -1.12253940105438232 MFLOPS 2 -1.13133072853088379 IFMOPS 1.00000000000000000 FIXPMOPS 12.00000000000000000 COSMOPS 0.49911013245582581 MFLOPS 3 0.99999982118606567 EQUMOPS 3.00000000000000000 EXPMOPS 0.93536460399627686 Numeric results of the other 7 threads were same as above End of test Thu Nov 9 14:20:48 2023

Вывод теста Whetstone на 3A50004 CPUs Available ############################################## Multithreading Single Precision Whetstones loongarch64 loongarch64 optimized Using 4 threads — Sun Dec 11 15:28:38 2022 Calibrate 0.00353 Seconds 1 Passes (x 100) 0.01669 Seconds 5 Passes (x 100) 0.08278 Seconds 25 Passes (x 100) 0.41330 Seconds 125 Passes (x 100) Use 3024 passes (x 100) MFLOPS 1 678 678 677 676 MFLOPS 2 678 676 676 670 IFMOPS 7495 7494 7493 7489 FIXPMOPS 2082 2082 2081 2080 COSMOPS 112 112 112 111 MFLOPS 3 600 599 599 597 EQUMOPS 4997 4991 4991 4967 EXPMOPS 63 63 63 63 millisec 8055 8068 8047 8083 MWIPS 3754 3748 3758 3741 MWIPS MFLOPS MFLOPS MFLOPS Cos Exp Fixpt If Equal Thread 1 2 3 MOPS MOPS MOPS MOPS MOPS 1 3754 676 678 599 112 63 2082 7489 4991 2 3748 678 676 599 111 63 2080 7494 4991 3 3758 678 676 600 112 63 2081 7493 4997 4 3741 677 670 597 112 63 2082 7495 4967 Total 15001 2708 2700 2395 446 252 8325 29971 19946 MWIPS 14939 Based on time for last thread to finish Results Of Calculations Thread 1 MFLOPS 1 -1.13214290142059326 MFLOPS 2 -1.13333344459533691 IFMOPS 1.00000000000000000 FIXPMOPS 12.00000000000000000 COSMOPS 0.50000011920928955 MFLOPS 3 0.99999982118606567 EQUMOPS 3.00000000000000000 EXPMOPS 0.93536460399627686 Numeric results of the other 3 threads were same as above End of test Sun Dec 11 15:28:48 2022 ########################################## Single Precision C Whetstone Benchmark loongarch64 loongarch64 optimized, Sun Dec 11 15:27:54 2022 Calibrate 0.00 Seconds 1 Passes (x 100) 0.01 Seconds 5 Passes (x 100) 0.06 Seconds 25 Passes (x 100) 0.32 Seconds 125 Passes (x 100) 1.60 Seconds 625 Passes (x 100) 8.01 Seconds 3125 Passes (x 100) Use 3900 passes (x 100) Single Precision C/C++ Whetstone Benchmark Loop content Result MFLOPS MOPS Seconds N1 floating point -1.12475013732910156 676.608 0.111 N2 floating point -1.12274742126464844 828.798 0.632 N3 if then else 1.00000000000000000 0.000 0.000 N4 fixed point 12.00000000000000000 74584.969 0.016 N5 sin,cos etc. 0.49911010265350342 100.223 3.238 N6 floating point 0.99999982118606567 598.946 3.512 N7 assignments 3.00000000000000000 3742.728 0.193 N8 exp,sqrt etc. 0.75110864639282227 63.179 2.296 MWIPS 3900.650 9.998

Читать на TechLife:  Huawei только начала, а уже в пятёрке лидеров. Компания заняла пятое место в списке крупнейших производителей чипов

Coremark

Современный тест, который должен заменить Dhrystone и Whetstone. Написан на C. Считает различные массивы, матрицы, сортировка массивов и т. д. Предназначался для запуска на всём: от микроконтроллеров до мощных процессоров.

Вывод однопоточного теста Coremark на 3A6000-HV2K performance run parameters for coremark. CoreMark Size : 666 Total ticks : 14105 Total time (secs): 14.105000 Iterations/Sec : 21269.053527 Iterations : 300000 Compiler version : GCC13.2.0 20230727 (AOSC OS, Core) Compiler flags : -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt Memory location : Please put data memory location here (e.g. code in flash, data on heap etc) seedcrc : 0xe9f5 [0]crclist : 0xe714 [0]crcmatrix : 0x1fd7 [0]crcstate : 0x8e3a [0]crcfinal : 0xcc42 Correct operation validated. See README.md for run and reporting rules. CoreMark 1.0 : 21269.053527 / GCC13.2.0 20230727 (AOSC OS, Core) -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt / Heap

Вывод многопоточного теста Coremark на 3A6000-HV2K performance run parameters for coremark. CoreMark Size : 666 Total ticks : 21161 Total time (secs): 21.161000 Iterations/Sec : 113416.190161 Iterations : 2400000 Compiler version : GCC13.2.0 20230727 (AOSC OS, Core) Compiler flags : -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt Parallel Fork : 8 Memory location : Please put data memory location here (e.g. code in flash, data on heap etc) seedcrc : 0xe9f5 [0]crclist : 0xe714 [1]crclist : 0xe714 [2]crclist : 0xe714 [3]crclist : 0xe714 [4]crclist : 0xe714 [5]crclist : 0xe714 [6]crclist : 0xe714 [7]crclist : 0xe714 [0]crcmatrix : 0x1fd7 [1]crcmatrix : 0x1fd7 [2]crcmatrix : 0x1fd7 [3]crcmatrix : 0x1fd7 [4]crcmatrix : 0x1fd7 [5]crcmatrix : 0x1fd7 [6]crcmatrix : 0x1fd7 [7]crcmatrix : 0x1fd7 [0]crcstate : 0x8e3a [1]crcstate : 0x8e3a [2]crcstate : 0x8e3a [3]crcstate : 0x8e3a [4]crcstate : 0x8e3a [5]crcstate : 0x8e3a [6]crcstate : 0x8e3a [7]crcstate : 0x8e3a [0]crcfinal : 0xcc42 [1]crcfinal : 0xcc42 [2]crcfinal : 0xcc42 [3]crcfinal : 0xcc42 [4]crcfinal : 0xcc42 [5]crcfinal : 0xcc42 [6]crcfinal : 0xcc42 [7]crcfinal : 0xcc42 Correct operation validated. See README.md for run and reporting rules. CoreMark 1.0 : 113416.190161 / GCC13.2.0 20230727 (AOSC OS, Core) -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt / Heap / 8:Fork

Вывод однопоточного теста Coremark на 3A5000 2K performance run parameters for coremark. CoreMark Size : 666 Total ticks : 13392 Total time (secs): 13.392000 Iterations/Sec : 14934.289128 Iterations : 200000 Compiler version : GCC8.3.0 Compiler flags : -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt Memory location : Please put data memory location here (e.g. code in flash, data on heap etc) seedcrc : 0xe9f5 [0]crclist : 0xe714 [0]crcmatrix : 0x1fd7 [0]crcstate : 0x8e3a [0]crcfinal : 0x4983 Correct operation validated. See README.md for run and reporting rules. CoreMark 1.0 : 14934.289128 / GCC8.3.0 -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt / Heap

Вывод многопоточного теста Coremark на 3A50002K performance run parameters for coremark. CoreMark Size : 666 Total ticks : 13646 Total time (secs): 13.646000 Iterations/Sec : 58625.238165 Iterations : 800000 Compiler version : GCC8.3.0 Compiler flags : -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt Parallel Fork : 4 Memory location : Please put data memory location here (e.g. code in flash, data on heap etc) seedcrc : 0xe9f5 [0]crclist : 0xe714 [1]crclist : 0xe714 [2]crclist : 0xe714 [3]crclist : 0xe714 [0]crcmatrix : 0x1fd7 [1]crcmatrix : 0x1fd7 [2]crcmatrix : 0x1fd7 [3]crcmatrix : 0x1fd7 [0]crcstate : 0x8e3a [1]crcstate : 0x8e3a [2]crcstate : 0x8e3a [3]crcstate : 0x8e3a [0]crcfinal : 0x4983 [1]crcfinal : 0x4983 [2]crcfinal : 0x4983 [3]crcfinal : 0x4983 Correct operation validated. See README.md for run and reporting rules. CoreMark 1.0 : 58625.238165 / GCC8.3.0 -Ofast -DPERFORMANCE_RUN=1 -DUSE_FORK=1 -lrt / Heap / 4:Fork

MP MFLOPS

Выполняет операции с плавающей запятой на векторах.

Вывод теста MP-MFLOPS на 3A6000-HV8 CPUs Available ############################################## 64 Bit MP SSE MFLOPS Benchmark 1, 8 Threads, Thu Nov 9 14:16:13 2023 Test 4 Byte Ops/ Repeat Seconds MFLOPS First All Words Word Passes Results Same Data in & out 102400 2 20000 0.059209 69178 0.620974 Yes Data in & out 1024000 2 2000 0.088311 46382 0.942935 Yes Data in & out 10240000 2 200 0.379903 10782 0.994032 Yes Data in & out 102400 8 20000 0.067177 243893 0.749972 Yes Data in & out 1024000 8 2000 0.087856 186487 0.965367 Yes Data in & out 10240000 8 200 0.523696 31285 0.996413 Yes Data in & out 102400 32 20000 0.219431 298663 See log No Data in & out 1024000 32 2000 0.217207 301721 0.910573 Yes Data in & out 10240000 32 200 0.490507 133609 See log No End of test Thu Nov 9 14:16:15 2023

Читать на TechLife:  ПСБ стал лучшим интернет-банком для индивидуальных предпринимателей и малого бизнеса

Вывод теста MP-MFLOPS на 3A50004 CPUs Available ############################################## 64 Bit MP SSE MFLOPS Benchmark 1, 4 Threads, Sun Dec 11 15:22:37 2022 Test 4 Byte Ops/ Repeat Seconds MFLOPS First All Words Word Passes Results Same Data in & out 102400 2 10000 0.086061 23797 0.764063 Yes Data in & out 1024000 2 1000 0.096334 21259 0.970753 Yes Data in & out 10240000 2 100 0.597981 3425 0.997008 Yes Data in & out 102400 8 10000 0.068533 119533 0.850919 Yes Data in & out 1024000 8 1000 0.069136 118490 0.982347 Yes Data in & out 10240000 8 100 0.593080 13813 0.998205 Yes Data in & out 102400 32 10000 0.304694 107544 0.660093 Yes Data in & out 1024000 32 1000 0.304863 107484 0.953624 Yes Data in & out 10240000 32 100 0.620384 52819 0.995219 Yes End of test Sun Dec 11 15:22:40 2022

7zip

Встроенный тест архиватора 7z.

Запускается так:

7z b

Вывод теста 7z на 3A50007-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=zh_CN.UTF-8,Utf16=on,HugeFiles=on,64 bits,4 CPUs LE) LE CPU Freq: 64000000 — — — — — — — — RAM size: 16165 MB, # CPU hardware threads: 4 RAM usage: 882 MB, # Benchmark threads: 4 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 11279 327 3352 10973 | 130124 396 2803 11102 23: 10681 325 3346 10883 | 127682 393 2810 11048 24: 11183 353 3406 12025 | 126626 395 2815 11116 25: 11099 360 3525 12673 | 124248 394 2805 11058 ———————————- | —————————— Avr: 341 3407 11638 | 395 2808 11081 Tot: 368 3108 11360

Вывод теста 7z на 3A6000# 7z b 7-Zip 17.04 : Copyright (c) 1999-2021 Igor Pavlov : 2017-08-28 p7zip Version 17.04 (locale=en_US.UTF-8,Utf16=on,HugeFiles=on,64 bits,8 CPUs LE) LE CPU Freq: — — — — — — — — — RAM size:   64995 MB,  # CPU hardware threads:   8 RAM usage:   1765 MB,  # Benchmark threads:      8                        Compressing  |                  Decompressing Dict     Speed Usage    R/U Rating  |      Speed Usage    R/U Rating          KiB/s     %   MIPS   MIPS  |      KiB/s     %   MIPS   MIPS 22:      21911   721   2958  21316  |     236360   798   2525  20161 23:      20562   710   2950  20950  |     233677   798   2535  20222 24:      19949   714   3005  21450  |     228709   796   2522  20073 25:      20072   738   3107  22918  |     225272   797   2517  20048 ———————————-  | —————————— Avr:             721   3005  21659  |              797   2525  20126 Tot:             759   2765  20892

STREAM

Тест производительности ОЗУ.

Вывод теста STREAM на 3A5000Function    Best Rate MB/s  Avg time     Min time     Max time Copy:           16748.3     0.009969     0.009553     0.010576 Scale:          18735.0     0.009437     0.008540     0.010660 Add:            16333.2     0.015492     0.014694     0.016449 Triad:          17796.0     0.014789     0.013486     0.015294

Вывод теста STREAM на 3A6000Function    Best Rate MB/s  Avg time     Min time     Max time Copy:           31521.7     0.040964     0.040607     0.041237 Scale:          31019.0     0.041808     0.041265     0.043131 Add:            31299.9     0.061691     0.061342     0.063623 Triad:          31452.7     0.061352     0.061044     0.061736

Версия компилятора, ядра Linux

 Ядро Linux на 3A5000:

Linux 4.19.167-rc5.lnd.1-loongson-3 #1 SMP Sat Apr 17 07:32:32 UTC 2021 loongarch64 loongarch64 loongarch64 GNU/Linux

Версия компилятора на 3A5000: 

gcc version 8.3.0 (Debian 8.3.0-6.lnd.vec.20).

Ядро Linux на 3A6000:

Linux 6.6.0-aosc-main #1 SMP PREEMPT Sun Oct 22 23:09:21 PDT 2023 loongarch64

Версия компилятора на 3A6000: 

cc (GCC) 13.2.0 20230727 (AOSC OS, Core)

Заключение

Процессор Loongson 3A6000 на архитектуре Loongarch64 имеет значительный прирост в однопоточных тестах в сравнении с Loongson 3A5000 и практически догоняет современные процессоры на архитектуре AMD64 (X86-64).

Ссылки

  • Результаты на Github

  • Документация по процессорам на Github

  • https://github.com/EntityFX/anybench/

  • https://github.com/EntityFX/EntityFX-Bench

  • Знакомство с Loongson 3A6000

  • Loongson Launches Next Generation 3A5000 CPU

  • Loongson Gearing Up to Ship 16-Core CPUs

  • Chinese Loongson CPU Takes on AMD’s Zen 3 in Benchmarks

  • Previewing China’s Loongson 3A5000 with Performance Counters

  • Процессоры Эльбрус | Фан-клуб

Теги:

  • loongson
  • loongarch
  • benchmarking
  • benchmark
  • бенчмарки

Хабы:

  • Высокая производительность
  • Процессоры

Источник

Оставьте ответ

Ваш электронный адрес не будет опубликован.

©Купоно-Мания.ру