1
Виконання циклу коду C [продовження]
Це питання продовжується на моє питання тут (за порадою Mystical): Продуктивність циклу коду C Продовжуючи своє запитання, коли я використовую упаковані інструкції замість скалярних інструкцій, код, що використовує внутрішні дані, буде виглядати дуже схожим: for(int i=0; i<size; i+=16) { y1 = _mm_load_ps(output[i]); … y4 = _mm_load_ps(output[i+12]); for(k=0; k<ksize; k++){ for(l=0; …