add sqrt_fast_f16/f32/f64