video-scaler: combine scaling operations
authorWim Taymans <wtaymans@redhat.com>
Tue, 25 Nov 2014 16:25:02 +0000 (17:25 +0100)
committerWim Taymans <wtaymans@redhat.com>
Tue, 25 Nov 2014 16:27:07 +0000 (17:27 +0100)
Combine add and scale of multiple lines/pixels to reduce the amount of
read and writes to temporary memory.

gst-libs/gst/video/video-orc-dist.c
gst-libs/gst/video/video-orc-dist.h
gst-libs/gst/video/video-orc.orc
gst-libs/gst/video/video-scaler.c

index 47a185c..e0ac2b3 100644 (file)
@@ -325,6 +325,19 @@ void video_orc_resample_h_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
 void video_orc_resample_h_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
     int d1_stride, const guint32 * ORC_RESTRICT s1, int s1_stride,
     const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m);
+void video_orc_resample_h_multaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n);
+void video_orc_resample_h_muladdtaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n);
+void video_orc_resample_h_muladdscaletaps3_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6,
+    const gint32 * ORC_RESTRICT s7, int n);
 void video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
     const gint32 * ORC_RESTRICT s1, int n);
 void video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
@@ -344,8 +357,20 @@ void video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
     const guint64 * ORC_RESTRICT s1, int p1, int n);
 void video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
     const guint32 * ORC_RESTRICT s1, int p1, int n);
+void video_orc_resample_v_multaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n);
 void video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
     const guint32 * ORC_RESTRICT s1, int p1, int n);
+void video_orc_resample_v_muladdtaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n);
+void video_orc_resample_v_muladdscaletaps4_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4,
+    const gint32 * ORC_RESTRICT s5, int p1, int p2, int p3, int p4, int n);
 void video_orc_chroma_down_h2_u8 (guint8 * ORC_RESTRICT d1,
     const guint8 * ORC_RESTRICT s1, int n);
 void video_orc_chroma_down_v2_u8 (guint8 * ORC_RESTRICT d1,
@@ -19318,88 +19343,158 @@ video_orc_resample_h_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1, int d1_stride,
 #endif
 
 
-/* video_orc_resample_scaletaps_u8_lq */
+/* video_orc_resample_h_multaps3_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
-    const gint32 * ORC_RESTRICT s1, int n)
+video_orc_resample_h_multaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n)
 {
   int i;
-  orc_int8 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  orc_union16 var33;
-#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
-  volatile orc_union16 var34;
-#else
-  orc_union16 var34;
-#endif
-  orc_int8 var35;
-  orc_union16 var36;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
   orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
 
-  ptr0 = (orc_int8 *) d1;
-  ptr4 = (orc_union16 *) s1;
+  ptr0 = (orc_union16 *) d1;
+  ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_union16 *) s4;
+  ptr8 = (orc_union16 *) s5;
+  ptr9 = (orc_union16 *) s6;
 
-  /* 1: loadpw */
-  var34.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var33 = ptr4[i];
-    /* 2: addw */
-    var36.i = var33.i + var34.i;
-    /* 3: shrsw */
-    var37.i = var36.i >> 6;
-    /* 4: convsuswb */
-    var35 = ORC_CLAMP_UB (var37.i);
-    /* 5: storeb */
-    ptr0[i] = var35;
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var41.i = (orc_uint8) var34;
+    /* 2: loadw */
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var42.i = (var41.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var43.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var44.i = (var43.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var45.i = var42.i + var44.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var46.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var47.i = (var46.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var40.i = var45.i + var47.i;
+    /* 14: storew */
+    ptr0[i] = var40;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_scaletaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_h_multaps3_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_int8 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  orc_union16 var33;
-#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
-  volatile orc_union16 var34;
-#else
-  orc_union16 var34;
-#endif
-  orc_int8 var35;
-  orc_union16 var36;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
   orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
 
-  ptr0 = (orc_int8 *) ex->arrays[0];
-  ptr4 = (orc_union16 *) ex->arrays[4];
+  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_union16 *) ex->arrays[7];
+  ptr8 = (orc_union16 *) ex->arrays[8];
+  ptr9 = (orc_union16 *) ex->arrays[9];
 
-  /* 1: loadpw */
-  var34.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var33 = ptr4[i];
-    /* 2: addw */
-    var36.i = var33.i + var34.i;
-    /* 3: shrsw */
-    var37.i = var36.i >> 6;
-    /* 4: convsuswb */
-    var35 = ORC_CLAMP_UB (var37.i);
-    /* 5: storeb */
-    ptr0[i] = var35;
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var41.i = (orc_uint8) var34;
+    /* 2: loadw */
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var42.i = (var41.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var43.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var44.i = (var43.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var45.i = var42.i + var44.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var46.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var47.i = (var46.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var40.i = var45.i + var47.i;
+    /* 14: storew */
+    ptr0[i] = var40;
   }
 
 }
 
 void
-video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
-    const gint32 * ORC_RESTRICT s1, int n)
+video_orc_resample_h_multaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -19413,33 +19508,48 @@ video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 34, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 115, 99, 97, 108, 101, 116, 97, 112, 115,
-        95,
-        117, 56, 95, 108, 113, 11, 1, 1, 12, 2, 2, 14, 2, 32, 0, 0,
-        0, 14, 2, 6, 0, 0, 0, 20, 2, 70, 32, 4, 16, 94, 32, 32,
-        17, 160, 0, 32, 2, 0,
+        1, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 116, 97, 112, 115,
+        51,
+        95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 12, 1, 1, 12,
+        1, 1, 12, 2, 2, 12, 2, 2, 12, 2, 2, 20, 2, 20, 2, 150,
+        32, 4, 89, 32, 32, 7, 150, 33, 5, 89, 33, 33, 8, 70, 32, 32,
+        33, 150, 33, 6, 89, 33, 33, 9, 70, 0, 32, 33, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_scaletaps_u8_lq);
+          _backup_video_orc_resample_h_multaps3_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_scaletaps_u8_lq");
+      orc_program_set_name (p, "video_orc_resample_h_multaps3_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_scaletaps_u8_lq);
-      orc_program_add_destination (p, 1, "d1");
-      orc_program_add_source (p, 2, "s1");
-      orc_program_add_constant (p, 2, 0x00000020, "c1");
-      orc_program_add_constant (p, 2, 0x00000006, "c2");
+          _backup_video_orc_resample_h_multaps3_u8_lq);
+      orc_program_add_destination (p, 2, "d1");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 2, "s4");
+      orc_program_add_source (p, 2, "s5");
+      orc_program_add_source (p, 2, "s6");
       orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
 
-      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_C1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "shrsw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_S4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S5,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S6,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_T2,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "convsuswb", 0, ORC_VAR_D1, ORC_VAR_T1,
-          ORC_VAR_D1, ORC_VAR_D1);
 #endif
 
       orc_program_compile (p);
@@ -19455,6 +19565,11 @@ video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
+  ex->arrays[ORC_VAR_S5] = (void *) s5;
+  ex->arrays[ORC_VAR_S6] = (void *) s6;
 
   func = c->exec;
   func (ex);
@@ -19462,84 +19577,1220 @@ video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_h_multaps_u16 */
+/* video_orc_resample_h_muladdtaps3_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n)
+video_orc_resample_h_muladdtaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n)
 {
   int i;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  const orc_union16 *ORC_RESTRICT ptr5;
-  orc_union16 var34;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
-  orc_union32 var38;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
 
-  ptr0 = (orc_union32 *) d1;
-  ptr4 = (orc_union16 *) s1;
-  ptr5 = (orc_union16 *) s2;
+  ptr0 = (orc_union16 *) d1;
+  ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_union16 *) s4;
+  ptr8 = (orc_union16 *) s5;
+  ptr9 = (orc_union16 *) s6;
 
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
+    /* 0: loadb */
     var34 = ptr4[i];
-    /* 1: convuwl */
-    var37.i = (orc_uint16) var34.i;
+    /* 1: convubw */
+    var42.i = (orc_uint8) var34;
     /* 2: loadw */
-    var35 = ptr5[i];
-    /* 3: convswl */
-    var38.i = var35.i;
-    /* 4: mulll */
-    var36.i = (((orc_uint32) var37.i) * ((orc_uint32) var38.i)) & 0xffffffff;
-    /* 5: storel */
-    ptr0[i] = var36;
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var43.i = (var42.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var44.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var45.i = (var44.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var46.i = var43.i + var45.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var47.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var48.i = (var47.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var49.i = var46.i + var48.i;
+    /* 14: loadw */
+    var40 = ptr0[i];
+    /* 15: addw */
+    var41.i = var40.i + var49.i;
+    /* 16: storew */
+    ptr0[i] = var41;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_h_multaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_h_muladdtaps3_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  const orc_union16 *ORC_RESTRICT ptr5;
-  orc_union16 var34;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+
+  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_union16 *) ex->arrays[7];
+  ptr8 = (orc_union16 *) ex->arrays[8];
+  ptr9 = (orc_union16 *) ex->arrays[9];
+
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var42.i = (orc_uint8) var34;
+    /* 2: loadw */
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var43.i = (var42.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var44.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var45.i = (var44.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var46.i = var43.i + var45.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var47.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var48.i = (var47.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var49.i = var46.i + var48.i;
+    /* 14: loadw */
+    var40 = ptr0[i];
+    /* 15: addw */
+    var41.i = var40.i + var49.i;
+    /* 16: storew */
+    ptr0[i] = var41;
+  }
+
+}
+
+void
+video_orc_resample_h_muladdtaps3_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 9, 38, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 97, 100, 100, 116,
+        97,
+        112, 115, 51, 95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 12,
+        1, 1, 12, 1, 1, 12, 2, 2, 12, 2, 2, 12, 2, 2, 20, 2,
+        20, 2, 150, 32, 4, 89, 32, 32, 7, 150, 33, 5, 89, 33, 33, 8,
+        70, 32, 32, 33, 150, 33, 6, 89, 33, 33, 9, 70, 32, 32, 33, 70,
+        0, 0, 32, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdtaps3_u8_lq);
+#else
+      p = orc_program_new ();
+      orc_program_set_name (p, "video_orc_resample_h_muladdtaps3_u8_lq");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdtaps3_u8_lq);
+      orc_program_add_destination (p, 2, "d1");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 2, "s4");
+      orc_program_add_source (p, 2, "s5");
+      orc_program_add_source (p, 2, "s6");
+      orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
+
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_S4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S5,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S6,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
+  ex->arrays[ORC_VAR_S5] = (void *) s5;
+  ex->arrays[ORC_VAR_S6] = (void *) s6;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_h_muladdscaletaps3_u8_lq */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_h_muladdscaletaps3_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6,
+    const gint32 * ORC_RESTRICT s7, int n)
+{
+  int i;
+  orc_int8 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  const orc_union16 *ORC_RESTRICT ptr10;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var41;
+#else
+  orc_union16 var41;
+#endif
+  orc_int8 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+
+  ptr0 = (orc_int8 *) d1;
+  ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_union16 *) s4;
+  ptr8 = (orc_union16 *) s5;
+  ptr9 = (orc_union16 *) s6;
+  ptr10 = (orc_union16 *) s7;
+
+  /* 16: loadpw */
+  var41.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var43.i = (orc_uint8) var34;
+    /* 2: loadw */
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var44.i = (var43.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var45.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var46.i = (var45.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var47.i = var44.i + var46.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var48.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var49.i = (var48.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var50.i = var47.i + var49.i;
+    /* 14: loadw */
+    var40 = ptr10[i];
+    /* 15: addw */
+    var51.i = var50.i + var40.i;
+    /* 17: addw */
+    var52.i = var51.i + var41.i;
+    /* 18: shrsw */
+    var53.i = var52.i >> 6;
+    /* 19: convsuswb */
+    var42 = ORC_CLAMP_UB (var53.i);
+    /* 20: storeb */
+    ptr0[i] = var42;
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_h_muladdscaletaps3_u8_lq (OrcExecutor *
+    ORC_RESTRICT ex)
+{
+  int i;
+  int n = ex->n;
+  orc_int8 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_union16 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  const orc_union16 *ORC_RESTRICT ptr9;
+  const orc_union16 *ORC_RESTRICT ptr10;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_union16 var40;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var41;
+#else
+  orc_union16 var41;
+#endif
+  orc_int8 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+
+  ptr0 = (orc_int8 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_union16 *) ex->arrays[7];
+  ptr8 = (orc_union16 *) ex->arrays[8];
+  ptr9 = (orc_union16 *) ex->arrays[9];
+  ptr10 = (orc_union16 *) ex->arrays[10];
+
+  /* 16: loadpw */
+  var41.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var43.i = (orc_uint8) var34;
+    /* 2: loadw */
+    var35 = ptr7[i];
+    /* 3: mullw */
+    var44.i = (var43.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var45.i = (orc_uint8) var36;
+    /* 6: loadw */
+    var37 = ptr8[i];
+    /* 7: mullw */
+    var46.i = (var45.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var47.i = var44.i + var46.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var48.i = (orc_uint8) var38;
+    /* 11: loadw */
+    var39 = ptr9[i];
+    /* 12: mullw */
+    var49.i = (var48.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var50.i = var47.i + var49.i;
+    /* 14: loadw */
+    var40 = ptr10[i];
+    /* 15: addw */
+    var51.i = var50.i + var40.i;
+    /* 17: addw */
+    var52.i = var51.i + var41.i;
+    /* 18: shrsw */
+    var53.i = var52.i >> 6;
+    /* 19: convsuswb */
+    var42 = ORC_CLAMP_UB (var53.i);
+    /* 20: storeb */
+    ptr0[i] = var42;
+  }
+
+}
+
+void
+video_orc_resample_h_muladdscaletaps3_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4,
+    const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6,
+    const gint32 * ORC_RESTRICT s7, int n)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 9, 43, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 97, 100, 100, 115,
+        99,
+        97, 108, 101, 116, 97, 112, 115, 51, 95, 117, 56, 95, 108, 113, 11, 1,
+        1, 12, 1, 1, 12, 1, 1, 12, 1, 1, 12, 2, 2, 12, 2, 2,
+        12, 2, 2, 12, 2, 2, 14, 2, 32, 0, 0, 0, 14, 2, 6, 0,
+        0, 0, 20, 2, 20, 2, 150, 32, 4, 89, 32, 32, 7, 150, 33, 5,
+        89, 33, 33, 8, 70, 32, 32, 33, 150, 33, 6, 89, 33, 33, 9, 70,
+        32, 32, 33, 70, 32, 32, 10, 70, 32, 32, 16, 94, 32, 32, 17, 160,
+        0, 32, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdscaletaps3_u8_lq);
+#else
+      p = orc_program_new ();
+      orc_program_set_name (p, "video_orc_resample_h_muladdscaletaps3_u8_lq");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdscaletaps3_u8_lq);
+      orc_program_add_destination (p, 1, "d1");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 2, "s4");
+      orc_program_add_source (p, 2, "s5");
+      orc_program_add_source (p, 2, "s6");
+      orc_program_add_source (p, 2, "s7");
+      orc_program_add_constant (p, 2, 0x00000020, "c1");
+      orc_program_add_constant (p, 2, 0x00000006, "c2");
+      orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
+
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_S4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S5,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_S6,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_S7,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "shrsw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convsuswb", 0, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1, ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
+  ex->arrays[ORC_VAR_S5] = (void *) s5;
+  ex->arrays[ORC_VAR_S6] = (void *) s6;
+  ex->arrays[ORC_VAR_S7] = (void *) s7;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_scaletaps_u8_lq */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
+    const gint32 * ORC_RESTRICT s1, int n)
+{
+  int i;
+  orc_int8 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 var33;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var34;
+#else
+  orc_union16 var34;
+#endif
+  orc_int8 var35;
+  orc_union16 var36;
+  orc_union16 var37;
+
+  ptr0 = (orc_int8 *) d1;
+  ptr4 = (orc_union16 *) s1;
+
+  /* 1: loadpw */
+  var34.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadw */
+    var33 = ptr4[i];
+    /* 2: addw */
+    var36.i = var33.i + var34.i;
+    /* 3: shrsw */
+    var37.i = var36.i >> 6;
+    /* 4: convsuswb */
+    var35 = ORC_CLAMP_UB (var37.i);
+    /* 5: storeb */
+    ptr0[i] = var35;
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_scaletaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
+{
+  int i;
+  int n = ex->n;
+  orc_int8 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 var33;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var34;
+#else
+  orc_union16 var34;
+#endif
+  orc_int8 var35;
+  orc_union16 var36;
+  orc_union16 var37;
+
+  ptr0 = (orc_int8 *) ex->arrays[0];
+  ptr4 = (orc_union16 *) ex->arrays[4];
+
+  /* 1: loadpw */
+  var34.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadw */
+    var33 = ptr4[i];
+    /* 2: addw */
+    var36.i = var33.i + var34.i;
+    /* 3: shrsw */
+    var37.i = var36.i >> 6;
+    /* 4: convsuswb */
+    var35 = ORC_CLAMP_UB (var37.i);
+    /* 5: storeb */
+    ptr0[i] = var35;
+  }
+
+}
+
+void
+video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1,
+    const gint32 * ORC_RESTRICT s1, int n)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 9, 34, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 115, 99, 97, 108, 101, 116, 97, 112, 115,
+        95,
+        117, 56, 95, 108, 113, 11, 1, 1, 12, 2, 2, 14, 2, 32, 0, 0,
+        0, 14, 2, 6, 0, 0, 0, 20, 2, 70, 32, 4, 16, 94, 32, 32,
+        17, 160, 0, 32, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_scaletaps_u8_lq);
+#else
+      p = orc_program_new ();
+      orc_program_set_name (p, "video_orc_resample_scaletaps_u8_lq");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_scaletaps_u8_lq);
+      orc_program_add_destination (p, 1, "d1");
+      orc_program_add_source (p, 2, "s1");
+      orc_program_add_constant (p, 2, 0x00000020, "c1");
+      orc_program_add_constant (p, 2, 0x00000006, "c2");
+      orc_program_add_temporary (p, 2, "t1");
+
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_C1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "shrsw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convsuswb", 0, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1, ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_h_multaps_u16 */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n)
+{
+  int i;
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  const orc_union16 *ORC_RESTRICT ptr5;
+  orc_union16 var34;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+  orc_union32 var38;
+
+  ptr0 = (orc_union32 *) d1;
+  ptr4 = (orc_union16 *) s1;
+  ptr5 = (orc_union16 *) s2;
+
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadw */
+    var34 = ptr4[i];
+    /* 1: convuwl */
+    var37.i = (orc_uint16) var34.i;
+    /* 2: loadw */
+    var35 = ptr5[i];
+    /* 3: convswl */
+    var38.i = var35.i;
+    /* 4: mulll */
+    var36.i = (((orc_uint32) var37.i) * ((orc_uint32) var38.i)) & 0xffffffff;
+    /* 5: storel */
+    ptr0[i] = var36;
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_h_multaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+{
+  int i;
+  int n = ex->n;
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  const orc_union16 *ORC_RESTRICT ptr5;
+  orc_union16 var34;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+  orc_union32 var38;
+
+  ptr0 = (orc_union32 *) ex->arrays[0];
+  ptr4 = (orc_union16 *) ex->arrays[4];
+  ptr5 = (orc_union16 *) ex->arrays[5];
+
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadw */
+    var34 = ptr4[i];
+    /* 1: convuwl */
+    var37.i = (orc_uint16) var34.i;
+    /* 2: loadw */
+    var35 = ptr5[i];
+    /* 3: convswl */
+    var38.i = var35.i;
+    /* 4: mulll */
+    var36.i = (((orc_uint32) var37.i) * ((orc_uint32) var38.i)) & 0xffffffff;
+    /* 5: storel */
+    ptr0[i] = var36;
+  }
+
+}
+
+void
+video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 9, 32, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 116, 97, 112, 115,
+        95,
+        117, 49, 54, 11, 4, 4, 12, 2, 2, 12, 2, 2, 20, 4, 20, 4,
+        154, 32, 4, 153, 33, 5, 120, 0, 32, 33, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_multaps_u16);
+#else
+      p = orc_program_new ();
+      orc_program_set_name (p, "video_orc_resample_h_multaps_u16");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_multaps_u16);
+      orc_program_add_destination (p, 4, "d1");
+      orc_program_add_source (p, 2, "s1");
+      orc_program_add_source (p, 2, "s2");
+      orc_program_add_temporary (p, 4, "t1");
+      orc_program_add_temporary (p, 4, "t2");
+
+      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mulll", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_h_muladdtaps_u16 */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
+    const guint64 * ORC_RESTRICT s1, int s1_stride,
+    const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m)
+{
+  int i;
+  int j;
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  const orc_union16 *ORC_RESTRICT ptr5;
+  orc_union16 var34;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+  orc_union32 var38;
+  orc_union32 var39;
+  orc_union32 var40;
+
+  for (j = 0; j < m; j++) {
+    ptr0 = ORC_PTR_OFFSET (d1, d1_stride * j);
+    ptr4 = ORC_PTR_OFFSET (s1, s1_stride * j);
+    ptr5 = ORC_PTR_OFFSET (s2, s2_stride * j);
+
+
+    for (i = 0; i < n; i++) {
+      /* 0: loadw */
+      var34 = ptr4[i];
+      /* 1: convuwl */
+      var38.i = (orc_uint16) var34.i;
+      /* 2: loadw */
+      var35 = ptr5[i];
+      /* 3: convswl */
+      var39.i = var35.i;
+      /* 4: mulll */
+      var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
+      /* 5: loadl */
+      var36 = ptr0[i];
+      /* 6: addl */
+      var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
+      /* 7: storel */
+      ptr0[i] = var37;
+    }
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_h_muladdtaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+{
+  int i;
+  int j;
+  int n = ex->n;
+  int m = ex->params[ORC_VAR_A1];
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  const orc_union16 *ORC_RESTRICT ptr5;
+  orc_union16 var34;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
   orc_union32 var38;
+  orc_union32 var39;
+  orc_union32 var40;
+
+  for (j = 0; j < m; j++) {
+    ptr0 = ORC_PTR_OFFSET (ex->arrays[0], ex->params[0] * j);
+    ptr4 = ORC_PTR_OFFSET (ex->arrays[4], ex->params[4] * j);
+    ptr5 = ORC_PTR_OFFSET (ex->arrays[5], ex->params[5] * j);
+
+
+    for (i = 0; i < n; i++) {
+      /* 0: loadw */
+      var34 = ptr4[i];
+      /* 1: convuwl */
+      var38.i = (orc_uint16) var34.i;
+      /* 2: loadw */
+      var35 = ptr5[i];
+      /* 3: convswl */
+      var39.i = var35.i;
+      /* 4: mulll */
+      var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
+      /* 5: loadl */
+      var36 = ptr0[i];
+      /* 6: addl */
+      var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
+      /* 7: storel */
+      ptr0[i] = var37;
+    }
+  }
+
+}
+
+void
+video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
+    const guint64 * ORC_RESTRICT s1, int s1_stride,
+    const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 7, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101,
+        115, 97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 97, 100, 100,
+        116,
+        97, 112, 115, 95, 117, 49, 54, 11, 4, 4, 12, 2, 2, 12, 2, 2,
+        20, 4, 20, 4, 154, 32, 4, 153, 33, 5, 120, 32, 32, 33, 103, 0,
+        0, 32, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdtaps_u16);
+#else
+      p = orc_program_new ();
+      orc_program_set_2d (p);
+      orc_program_set_name (p, "video_orc_resample_h_muladdtaps_u16");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_h_muladdtaps_u16);
+      orc_program_add_destination (p, 4, "d1");
+      orc_program_add_source (p, 2, "s1");
+      orc_program_add_source (p, 2, "s2");
+      orc_program_add_temporary (p, 4, "t1");
+      orc_program_add_temporary (p, 4, "t2");
+
+      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mulll", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ORC_EXECUTOR_M (ex) = m;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->params[ORC_VAR_D1] = d1_stride;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->params[ORC_VAR_S1] = s1_stride;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->params[ORC_VAR_S2] = s2_stride;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_scaletaps_u16 */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
+    const gint32 * ORC_RESTRICT s1, int n)
+{
+  int i;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_union32 *ORC_RESTRICT ptr4;
+  orc_union32 var33;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union32 var34;
+#else
+  orc_union32 var34;
+#endif
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+
+  ptr0 = (orc_union16 *) d1;
+  ptr4 = (orc_union32 *) s1;
+
+  /* 1: loadpl */
+  var34.i = (int) 0x00000fff;   /* 4095 or 2.0232e-320f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadl */
+    var33 = ptr4[i];
+    /* 2: addl */
+    var36.i = ((orc_uint32) var33.i) + ((orc_uint32) var34.i);
+    /* 3: shrsl */
+    var37.i = var36.i >> 12;
+    /* 4: convsuslw */
+    var35.i = ORC_CLAMP_UW (var37.i);
+    /* 5: storew */
+    ptr0[i] = var35;
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_scaletaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+{
+  int i;
+  int n = ex->n;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_union32 *ORC_RESTRICT ptr4;
+  orc_union32 var33;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union32 var34;
+#else
+  orc_union32 var34;
+#endif
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+
+  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr4 = (orc_union32 *) ex->arrays[4];
+
+  /* 1: loadpl */
+  var34.i = (int) 0x00000fff;   /* 4095 or 2.0232e-320f */
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadl */
+    var33 = ptr4[i];
+    /* 2: addl */
+    var36.i = ((orc_uint32) var33.i) + ((orc_uint32) var34.i);
+    /* 3: shrsl */
+    var37.i = var36.i >> 12;
+    /* 4: convsuslw */
+    var35.i = ORC_CLAMP_UW (var37.i);
+    /* 5: storew */
+    ptr0[i] = var35;
+  }
+
+}
+
+void
+video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
+    const gint32 * ORC_RESTRICT s1, int n)
+{
+  OrcExecutor _ex, *ex = &_ex;
+  static volatile int p_inited = 0;
+  static OrcCode *c = 0;
+  void (*func) (OrcExecutor *);
+
+  if (!p_inited) {
+    orc_once_mutex_lock ();
+    if (!p_inited) {
+      OrcProgram *p;
+
+#if 1
+      static const orc_uint8 bc[] = {
+        1, 9, 32, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 115, 99, 97, 108, 101, 116, 97, 112, 115,
+        95,
+        117, 49, 54, 11, 2, 2, 12, 4, 4, 14, 4, 255, 15, 0, 0, 14,
+        4, 12, 0, 0, 0, 20, 4, 103, 32, 4, 16, 125, 32, 32, 17, 166,
+        0, 32, 2, 0,
+      };
+      p = orc_program_new_from_static_bytecode (bc);
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_scaletaps_u16);
+#else
+      p = orc_program_new ();
+      orc_program_set_name (p, "video_orc_resample_scaletaps_u16");
+      orc_program_set_backup_function (p,
+          _backup_video_orc_resample_scaletaps_u16);
+      orc_program_add_destination (p, 2, "d1");
+      orc_program_add_source (p, 4, "s1");
+      orc_program_add_constant (p, 4, 0x00000fff, "c1");
+      orc_program_add_constant (p, 4, 0x0000000c, "c2");
+      orc_program_add_temporary (p, 4, "t1");
+
+      orc_program_append_2 (p, "addl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_C1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "shrsl", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convsuslw", 0, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1, ORC_VAR_D1);
+#endif
+
+      orc_program_compile (p);
+      c = orc_program_take_code (p);
+      orc_program_free (p);
+    }
+    p_inited = TRUE;
+    orc_once_mutex_unlock ();
+  }
+  ex->arrays[ORC_VAR_A2] = c;
+  ex->program = 0;
+
+  ex->n = n;
+  ex->arrays[ORC_VAR_D1] = d1;
+  ex->arrays[ORC_VAR_S1] = (void *) s1;
+
+  func = c->exec;
+  func (ex);
+}
+#endif
+
+
+/* video_orc_resample_v_multaps_u8 */
+#ifdef DISABLE_ORC
+void
+video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
+{
+  int i;
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var33;
+  orc_union16 var34;
+  orc_union32 var35;
+  orc_union16 var36;
+
+  ptr0 = (orc_union32 *) d1;
+  ptr4 = (orc_int8 *) s1;
+
+  /* 2: loadpw */
+  var34.i = p1;
+
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var33 = ptr4[i];
+    /* 1: convubw */
+    var36.i = (orc_uint8) var33;
+    /* 3: mulswl */
+    var35.i = var36.i * var34.i;
+    /* 4: storel */
+    ptr0[i] = var35;
+  }
+
+}
+
+#else
+static void
+_backup_video_orc_resample_v_multaps_u8 (OrcExecutor * ORC_RESTRICT ex)
+{
+  int i;
+  int n = ex->n;
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var33;
+  orc_union16 var34;
+  orc_union32 var35;
+  orc_union16 var36;
 
   ptr0 = (orc_union32 *) ex->arrays[0];
-  ptr4 = (orc_union16 *) ex->arrays[4];
-  ptr5 = (orc_union16 *) ex->arrays[5];
+  ptr4 = (orc_int8 *) ex->arrays[4];
 
+  /* 2: loadpw */
+  var34.i = ex->params[24];
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var34 = ptr4[i];
-    /* 1: convuwl */
-    var37.i = (orc_uint16) var34.i;
-    /* 2: loadw */
-    var35 = ptr5[i];
-    /* 3: convswl */
-    var38.i = var35.i;
-    /* 4: mulll */
-    var36.i = (((orc_uint32) var37.i) * ((orc_uint32) var38.i)) & 0xffffffff;
-    /* 5: storel */
-    ptr0[i] = var36;
+    /* 0: loadb */
+    var33 = ptr4[i];
+    /* 1: convubw */
+    var36.i = (orc_uint8) var33;
+    /* 3: mulswl */
+    var35.i = var36.i * var34.i;
+    /* 4: storel */
+    ptr0[i] = var35;
   }
 
 }
 
 void
-video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n)
+video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -19553,31 +20804,28 @@ video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 32, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 116, 97, 112, 115,
+        1, 9, 31, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
         95,
-        117, 49, 54, 11, 4, 4, 12, 2, 2, 12, 2, 2, 20, 4, 20, 4,
-        154, 32, 4, 153, 33, 5, 120, 0, 32, 33, 2, 0,
+        117, 56, 11, 4, 4, 12, 1, 1, 16, 2, 20, 2, 150, 32, 4, 176,
+        0, 32, 24, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_h_multaps_u16);
+          _backup_video_orc_resample_v_multaps_u8);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_h_multaps_u16");
+      orc_program_set_name (p, "video_orc_resample_v_multaps_u8");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_h_multaps_u16);
+          _backup_video_orc_resample_v_multaps_u8);
       orc_program_add_destination (p, 4, "d1");
-      orc_program_add_source (p, 2, "s1");
-      orc_program_add_source (p, 2, "s2");
-      orc_program_add_temporary (p, 4, "t1");
-      orc_program_add_temporary (p, 4, "t2");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_parameter (p, 2, "p1");
+      orc_program_add_temporary (p, 2, "t1");
 
-      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
-          ORC_VAR_D1);
-      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulll", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_T2,
+      orc_program_append_2 (p, "mulswl", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
 #endif
 
@@ -19594,7 +20842,7 @@ video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
-  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->params[ORC_VAR_P1] = p1;
 
   func = c->exec;
   func (ex);
@@ -19602,105 +20850,86 @@ video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_h_muladdtaps_u16 */
+/* video_orc_resample_v_muladdtaps_u8 */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
-    const guint64 * ORC_RESTRICT s1, int s1_stride,
-    const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m)
+video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   int i;
-  int j;
   orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  const orc_union16 *ORC_RESTRICT ptr5;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var34;
   orc_union16 var35;
   orc_union32 var36;
   orc_union32 var37;
-  orc_union32 var38;
+  orc_union16 var38;
   orc_union32 var39;
-  orc_union32 var40;
 
-  for (j = 0; j < m; j++) {
-    ptr0 = ORC_PTR_OFFSET (d1, d1_stride * j);
-    ptr4 = ORC_PTR_OFFSET (s1, s1_stride * j);
-    ptr5 = ORC_PTR_OFFSET (s2, s2_stride * j);
+  ptr0 = (orc_union32 *) d1;
+  ptr4 = (orc_int8 *) s1;
 
+  /* 2: loadpw */
+  var35.i = p1;
 
-    for (i = 0; i < n; i++) {
-      /* 0: loadw */
-      var34 = ptr4[i];
-      /* 1: convuwl */
-      var38.i = (orc_uint16) var34.i;
-      /* 2: loadw */
-      var35 = ptr5[i];
-      /* 3: convswl */
-      var39.i = var35.i;
-      /* 4: mulll */
-      var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
-      /* 5: loadl */
-      var36 = ptr0[i];
-      /* 6: addl */
-      var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
-      /* 7: storel */
-      ptr0[i] = var37;
-    }
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var38.i = (orc_uint8) var34;
+    /* 3: mulswl */
+    var39.i = var38.i * var35.i;
+    /* 4: loadl */
+    var36 = ptr0[i];
+    /* 5: addl */
+    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var39.i);
+    /* 6: storel */
+    ptr0[i] = var37;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_h_muladdtaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_muladdtaps_u8 (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
-  int j;
   int n = ex->n;
-  int m = ex->params[ORC_VAR_A1];
   orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  const orc_union16 *ORC_RESTRICT ptr5;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var34;
   orc_union16 var35;
   orc_union32 var36;
   orc_union32 var37;
-  orc_union32 var38;
+  orc_union16 var38;
   orc_union32 var39;
-  orc_union32 var40;
 
-  for (j = 0; j < m; j++) {
-    ptr0 = ORC_PTR_OFFSET (ex->arrays[0], ex->params[0] * j);
-    ptr4 = ORC_PTR_OFFSET (ex->arrays[4], ex->params[4] * j);
-    ptr5 = ORC_PTR_OFFSET (ex->arrays[5], ex->params[5] * j);
+  ptr0 = (orc_union32 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
 
+  /* 2: loadpw */
+  var35.i = ex->params[24];
 
-    for (i = 0; i < n; i++) {
-      /* 0: loadw */
-      var34 = ptr4[i];
-      /* 1: convuwl */
-      var38.i = (orc_uint16) var34.i;
-      /* 2: loadw */
-      var35 = ptr5[i];
-      /* 3: convswl */
-      var39.i = var35.i;
-      /* 4: mulll */
-      var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
-      /* 5: loadl */
-      var36 = ptr0[i];
-      /* 6: addl */
-      var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
-      /* 7: storel */
-      ptr0[i] = var37;
-    }
+  for (i = 0; i < n; i++) {
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var38.i = (orc_uint8) var34;
+    /* 3: mulswl */
+    var39.i = var38.i * var35.i;
+    /* 4: loadl */
+    var36 = ptr0[i];
+    /* 5: addl */
+    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var39.i);
+    /* 6: storel */
+    ptr0[i] = var37;
   }
 
 }
 
 void
-video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
-    const guint64 * ORC_RESTRICT s1, int s1_stride,
-    const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m)
+video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -19714,35 +20943,31 @@ video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 7, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101,
-        115, 97, 109, 112, 108, 101, 95, 104, 95, 109, 117, 108, 97, 100, 100,
-        116,
-        97, 112, 115, 95, 117, 49, 54, 11, 4, 4, 12, 2, 2, 12, 2, 2,
-        20, 4, 20, 4, 154, 32, 4, 153, 33, 5, 120, 32, 32, 33, 103, 0,
-        0, 32, 2, 0,
+        1, 9, 34, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
+        97,
+        112, 115, 95, 117, 56, 11, 4, 4, 12, 1, 1, 16, 2, 20, 2, 20,
+        4, 150, 32, 4, 176, 33, 32, 24, 103, 0, 0, 33, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_h_muladdtaps_u16);
+          _backup_video_orc_resample_v_muladdtaps_u8);
 #else
       p = orc_program_new ();
-      orc_program_set_2d (p);
-      orc_program_set_name (p, "video_orc_resample_h_muladdtaps_u16");
+      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u8");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_h_muladdtaps_u16);
+          _backup_video_orc_resample_v_muladdtaps_u8);
       orc_program_add_destination (p, 4, "d1");
-      orc_program_add_source (p, 2, "s1");
-      orc_program_add_source (p, 2, "s2");
-      orc_program_add_temporary (p, 4, "t1");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_parameter (p, 2, "p1");
+      orc_program_add_temporary (p, 2, "t1");
       orc_program_add_temporary (p, 4, "t2");
 
-      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
-          ORC_VAR_D1);
-      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulll", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+      orc_program_append_2 (p, "mulswl", 0, ORC_VAR_T2, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
+      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T2,
           ORC_VAR_D1);
 #endif
 
@@ -19757,13 +20982,9 @@ video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
   ex->program = 0;
 
   ex->n = n;
-  ORC_EXECUTOR_M (ex) = m;
   ex->arrays[ORC_VAR_D1] = d1;
-  ex->params[ORC_VAR_D1] = d1_stride;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
-  ex->params[ORC_VAR_S1] = s1_stride;
-  ex->arrays[ORC_VAR_S2] = (void *) s2;
-  ex->params[ORC_VAR_S2] = s2_stride;
+  ex->params[ORC_VAR_P1] = p1;
 
   func = c->exec;
   func (ex);
@@ -19771,41 +20992,34 @@ video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride,
 #endif
 
 
-/* video_orc_resample_scaletaps_u16 */
+/* video_orc_resample_v_multaps_u16 */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
-    const gint32 * ORC_RESTRICT s1, int n)
+video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, int p1, int n)
 {
   int i;
-  orc_union16 *ORC_RESTRICT ptr0;
-  const orc_union32 *ORC_RESTRICT ptr4;
-  orc_union32 var33;
-#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
-  volatile orc_union32 var34;
-#else
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 var33;
   orc_union32 var34;
-#endif
-  orc_union16 var35;
+  orc_union32 var35;
   orc_union32 var36;
-  orc_union32 var37;
 
-  ptr0 = (orc_union16 *) d1;
-  ptr4 = (orc_union32 *) s1;
+  ptr0 = (orc_union32 *) d1;
+  ptr4 = (orc_union16 *) s1;
 
-  /* 1: loadpl */
-  var34.i = (int) 0x00000fff;   /* 4095 or 2.0232e-320f */
+  /* 2: loadpl */
+  var34.i = p1;
 
   for (i = 0; i < n; i++) {
-    /* 0: loadl */
+    /* 0: loadw */
     var33 = ptr4[i];
-    /* 2: addl */
-    var36.i = ((orc_uint32) var33.i) + ((orc_uint32) var34.i);
-    /* 3: shrsl */
-    var37.i = var36.i >> 12;
-    /* 4: convsuslw */
-    var35.i = ORC_CLAMP_UW (var37.i);
-    /* 5: storew */
+    /* 1: convuwl */
+    var36.i = (orc_uint16) var33.i;
+    /* 3: mulll */
+    var35.i = (((orc_uint32) var36.i) * ((orc_uint32) var34.i)) & 0xffffffff;
+    /* 4: storel */
     ptr0[i] = var35;
   }
 
@@ -19813,46 +21027,39 @@ video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
 
 #else
 static void
-_backup_video_orc_resample_scaletaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_multaps_u16 (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union16 *ORC_RESTRICT ptr0;
-  const orc_union32 *ORC_RESTRICT ptr4;
-  orc_union32 var33;
-#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
-  volatile orc_union32 var34;
-#else
+  orc_union32 *ORC_RESTRICT ptr0;
+  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 var33;
   orc_union32 var34;
-#endif
-  orc_union16 var35;
+  orc_union32 var35;
   orc_union32 var36;
-  orc_union32 var37;
 
-  ptr0 = (orc_union16 *) ex->arrays[0];
-  ptr4 = (orc_union32 *) ex->arrays[4];
+  ptr0 = (orc_union32 *) ex->arrays[0];
+  ptr4 = (orc_union16 *) ex->arrays[4];
 
-  /* 1: loadpl */
-  var34.i = (int) 0x00000fff;   /* 4095 or 2.0232e-320f */
+  /* 2: loadpl */
+  var34.i = ex->params[24];
 
   for (i = 0; i < n; i++) {
-    /* 0: loadl */
+    /* 0: loadw */
     var33 = ptr4[i];
-    /* 2: addl */
-    var36.i = ((orc_uint32) var33.i) + ((orc_uint32) var34.i);
-    /* 3: shrsl */
-    var37.i = var36.i >> 12;
-    /* 4: convsuslw */
-    var35.i = ORC_CLAMP_UW (var37.i);
-    /* 5: storew */
+    /* 1: convuwl */
+    var36.i = (orc_uint16) var33.i;
+    /* 3: mulll */
+    var35.i = (((orc_uint32) var36.i) * ((orc_uint32) var34.i)) & 0xffffffff;
+    /* 4: storel */
     ptr0[i] = var35;
   }
 
 }
 
 void
-video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
-    const gint32 * ORC_RESTRICT s1, int n)
+video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -19867,32 +21074,28 @@ video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
 #if 1
       static const orc_uint8 bc[] = {
         1, 9, 32, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 115, 99, 97, 108, 101, 116, 97, 112, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
         95,
-        117, 49, 54, 11, 2, 2, 12, 4, 4, 14, 4, 255, 15, 0, 0, 14,
-        4, 12, 0, 0, 0, 20, 4, 103, 32, 4, 16, 125, 32, 32, 17, 166,
-        0, 32, 2, 0,
+        117, 49, 54, 11, 4, 4, 12, 2, 2, 16, 2, 20, 4, 154, 32, 4,
+        120, 0, 32, 24, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_scaletaps_u16);
+          _backup_video_orc_resample_v_multaps_u16);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_scaletaps_u16");
+      orc_program_set_name (p, "video_orc_resample_v_multaps_u16");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_scaletaps_u16);
-      orc_program_add_destination (p, 2, "d1");
-      orc_program_add_source (p, 4, "s1");
-      orc_program_add_constant (p, 4, 0x00000fff, "c1");
-      orc_program_add_constant (p, 4, 0x0000000c, "c2");
+          _backup_video_orc_resample_v_multaps_u16);
+      orc_program_add_destination (p, 4, "d1");
+      orc_program_add_source (p, 2, "s1");
+      orc_program_add_parameter (p, 2, "p1");
       orc_program_add_temporary (p, 4, "t1");
 
-      orc_program_append_2 (p, "addl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_C1,
+      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "shrsl", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
+      orc_program_append_2 (p, "mulll", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "convsuslw", 0, ORC_VAR_D1, ORC_VAR_T1,
-          ORC_VAR_D1, ORC_VAR_D1);
 #endif
 
       orc_program_compile (p);
@@ -19908,6 +21111,7 @@ video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->params[ORC_VAR_P1] = p1;
 
   func = c->exec;
   func (ex);
@@ -19915,74 +21119,92 @@ video_orc_resample_scaletaps_u16 (guint64 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_multaps_u8 */
+/* video_orc_resample_v_muladdtaps_u16 */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, int p1, int n)
 {
   int i;
   orc_union32 *ORC_RESTRICT ptr0;
-  const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
+  const orc_union16 *ORC_RESTRICT ptr4;
   orc_union16 var34;
-  orc_union32 var35;
-  orc_union16 var36;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+  orc_union32 var38;
+  orc_union32 var39;
+  orc_union32 var40;
 
   ptr0 = (orc_union32 *) d1;
-  ptr4 = (orc_int8 *) s1;
+  ptr4 = (orc_union16 *) s1;
 
   /* 2: loadpw */
-  var34.i = p1;
+  var35.i = p1;
 
   for (i = 0; i < n; i++) {
-    /* 0: loadb */
-    var33 = ptr4[i];
-    /* 1: convubw */
-    var36.i = (orc_uint8) var33;
-    /* 3: mulswl */
-    var35.i = var36.i * var34.i;
-    /* 4: storel */
-    ptr0[i] = var35;
+    /* 0: loadw */
+    var34 = ptr4[i];
+    /* 1: convuwl */
+    var38.i = (orc_uint16) var34.i;
+    /* 3: convswl */
+    var39.i = var35.i;
+    /* 4: mulll */
+    var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
+    /* 5: loadl */
+    var36 = ptr0[i];
+    /* 6: addl */
+    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
+    /* 7: storel */
+    ptr0[i] = var37;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_multaps_u8 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_muladdtaps_u16 (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
   orc_union32 *ORC_RESTRICT ptr0;
-  const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
+  const orc_union16 *ORC_RESTRICT ptr4;
   orc_union16 var34;
-  orc_union32 var35;
-  orc_union16 var36;
+  orc_union16 var35;
+  orc_union32 var36;
+  orc_union32 var37;
+  orc_union32 var38;
+  orc_union32 var39;
+  orc_union32 var40;
 
   ptr0 = (orc_union32 *) ex->arrays[0];
-  ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr4 = (orc_union16 *) ex->arrays[4];
 
   /* 2: loadpw */
-  var34.i = ex->params[24];
+  var35.i = ex->params[24];
 
   for (i = 0; i < n; i++) {
-    /* 0: loadb */
-    var33 = ptr4[i];
-    /* 1: convubw */
-    var36.i = (orc_uint8) var33;
-    /* 3: mulswl */
-    var35.i = var36.i * var34.i;
-    /* 4: storel */
-    ptr0[i] = var35;
+    /* 0: loadw */
+    var34 = ptr4[i];
+    /* 1: convuwl */
+    var38.i = (orc_uint16) var34.i;
+    /* 3: convswl */
+    var39.i = var35.i;
+    /* 4: mulll */
+    var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
+    /* 5: loadl */
+    var36 = ptr0[i];
+    /* 6: addl */
+    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
+    /* 7: storel */
+    ptr0[i] = var37;
   }
 
 }
 
 void
-video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
+    const guint64 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -19996,28 +21218,34 @@ video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 31, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
-        95,
-        117, 56, 11, 4, 4, 12, 1, 1, 16, 2, 20, 2, 150, 32, 4, 176,
-        0, 32, 24, 2, 0,
+        1, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
+        97,
+        112, 115, 95, 117, 49, 54, 11, 4, 4, 12, 2, 2, 16, 2, 20, 4,
+        20, 4, 154, 32, 4, 153, 33, 24, 120, 32, 32, 33, 103, 0, 0, 32,
+        2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u8);
+          _backup_video_orc_resample_v_muladdtaps_u16);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_multaps_u8");
+      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u16");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u8);
+          _backup_video_orc_resample_v_muladdtaps_u16);
       orc_program_add_destination (p, 4, "d1");
-      orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 2, "s1");
       orc_program_add_parameter (p, 2, "p1");
-      orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 4, "t1");
+      orc_program_add_temporary (p, 4, "t2");
 
-      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulswl", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
+      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_P1, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mulll", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
           ORC_VAR_D1);
 #endif
 
@@ -20042,85 +21270,73 @@ video_orc_resample_v_multaps_u8 (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_muladdtaps_u8 */
+/* video_orc_resample_v_multaps_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
+video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
     const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   int i;
-  orc_union32 *ORC_RESTRICT ptr0;
+  orc_union16 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var34;
+  orc_int8 var33;
+  orc_union16 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
-  orc_union16 var38;
-  orc_union32 var39;
+  orc_union16 var36;
 
-  ptr0 = (orc_union32 *) d1;
+  ptr0 = (orc_union16 *) d1;
   ptr4 = (orc_int8 *) s1;
 
   /* 2: loadpw */
-  var35.i = p1;
+  var34.i = p1;
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var34 = ptr4[i];
+    var33 = ptr4[i];
     /* 1: convubw */
-    var38.i = (orc_uint8) var34;
-    /* 3: mulswl */
-    var39.i = var38.i * var35.i;
-    /* 4: loadl */
-    var36 = ptr0[i];
-    /* 5: addl */
-    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var39.i);
-    /* 6: storel */
-    ptr0[i] = var37;
+    var36.i = (orc_uint8) var33;
+    /* 3: mullw */
+    var35.i = (var36.i * var34.i) & 0xffff;
+    /* 4: storew */
+    ptr0[i] = var35;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_muladdtaps_u8 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_multaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union32 *ORC_RESTRICT ptr0;
+  orc_union16 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var34;
+  orc_int8 var33;
+  orc_union16 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
-  orc_union16 var38;
-  orc_union32 var39;
+  orc_union16 var36;
 
-  ptr0 = (orc_union32 *) ex->arrays[0];
+  ptr0 = (orc_union16 *) ex->arrays[0];
   ptr4 = (orc_int8 *) ex->arrays[4];
 
   /* 2: loadpw */
-  var35.i = ex->params[24];
+  var34.i = ex->params[24];
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var34 = ptr4[i];
+    var33 = ptr4[i];
     /* 1: convubw */
-    var38.i = (orc_uint8) var34;
-    /* 3: mulswl */
-    var39.i = var38.i * var35.i;
-    /* 4: loadl */
-    var36 = ptr0[i];
-    /* 5: addl */
-    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var39.i);
-    /* 6: storel */
-    ptr0[i] = var37;
+    var36.i = (orc_uint8) var33;
+    /* 3: mullw */
+    var35.i = (var36.i * var34.i) & 0xffff;
+    /* 4: storew */
+    ptr0[i] = var35;
   }
 
 }
 
 void
-video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
+video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
     const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
@@ -20136,30 +21352,27 @@ video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
 #if 1
       static const orc_uint8 bc[] = {
         1, 9, 34, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
-        97,
-        112, 115, 95, 117, 56, 11, 4, 4, 12, 1, 1, 16, 2, 20, 2, 20,
-        4, 150, 32, 4, 176, 33, 32, 24, 103, 0, 0, 33, 2, 0,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
+        95,
+        117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 16, 2, 20, 2, 150,
+        32, 4, 89, 0, 32, 24, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u8);
+          _backup_video_orc_resample_v_multaps_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u8");
+      orc_program_set_name (p, "video_orc_resample_v_multaps_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u8);
-      orc_program_add_destination (p, 4, "d1");
+          _backup_video_orc_resample_v_multaps_u8_lq);
+      orc_program_add_destination (p, 2, "d1");
       orc_program_add_source (p, 1, "s1");
       orc_program_add_parameter (p, 2, "p1");
       orc_program_add_temporary (p, 2, "t1");
-      orc_program_add_temporary (p, 4, "t2");
 
       orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulswl", 0, ORC_VAR_T2, ORC_VAR_T1, ORC_VAR_P1,
-          ORC_VAR_D1);
-      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T2,
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
 #endif
 
@@ -20184,74 +21397,180 @@ video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_multaps_u16 */
+/* video_orc_resample_v_multaps4_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_multaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n)
 {
   int i;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  orc_union16 var33;
-  orc_union32 var34;
-  orc_union32 var35;
-  orc_union32 var36;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
 
-  ptr0 = (orc_union32 *) d1;
-  ptr4 = (orc_union16 *) s1;
+  ptr0 = (orc_union16 *) d1;
+  ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_int8 *) s4;
 
-  /* 2: loadpl */
-  var34.i = p1;
+  /* 2: loadpw */
+  var35.i = p1;
+  /* 6: loadpw */
+  var37.i = p2;
+  /* 11: loadpw */
+  var39.i = p3;
+  /* 16: loadpw */
+  var41.i = p4;
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var33 = ptr4[i];
-    /* 1: convuwl */
-    var36.i = (orc_uint16) var33.i;
-    /* 3: mulll */
-    var35.i = (((orc_uint32) var36.i) * ((orc_uint32) var34.i)) & 0xffffffff;
-    /* 4: storel */
-    ptr0[i] = var35;
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var43.i = (orc_uint8) var34;
+    /* 3: mullw */
+    var44.i = (var43.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var45.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var46.i = (var45.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var47.i = var44.i + var46.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var48.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var49.i = (var48.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var50.i = var47.i + var49.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var51.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var52.i = (var51.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var42.i = var50.i + var52.i;
+    /* 19: storew */
+    ptr0[i] = var42;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_multaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_multaps4_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
-  orc_union16 var33;
-  orc_union32 var34;
-  orc_union32 var35;
-  orc_union32 var36;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  orc_int8 var34;
+  orc_union16 var35;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
 
-  ptr0 = (orc_union32 *) ex->arrays[0];
-  ptr4 = (orc_union16 *) ex->arrays[4];
+  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_int8 *) ex->arrays[7];
 
-  /* 2: loadpl */
-  var34.i = ex->params[24];
+  /* 2: loadpw */
+  var35.i = ex->params[24];
+  /* 6: loadpw */
+  var37.i = ex->params[25];
+  /* 11: loadpw */
+  var39.i = ex->params[26];
+  /* 16: loadpw */
+  var41.i = ex->params[27];
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var33 = ptr4[i];
-    /* 1: convuwl */
-    var36.i = (orc_uint16) var33.i;
-    /* 3: mulll */
-    var35.i = (((orc_uint32) var36.i) * ((orc_uint32) var34.i)) & 0xffffffff;
-    /* 4: storel */
-    ptr0[i] = var35;
+    /* 0: loadb */
+    var34 = ptr4[i];
+    /* 1: convubw */
+    var43.i = (orc_uint8) var34;
+    /* 3: mullw */
+    var44.i = (var43.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var45.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var46.i = (var45.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var47.i = var44.i + var46.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var48.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var49.i = (var48.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var50.i = var47.i + var49.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var51.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var52.i = (var51.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var42.i = var50.i + var52.i;
+    /* 19: storew */
+    ptr0[i] = var42;
   }
 
 }
 
 void
-video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_multaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -20265,28 +21584,56 @@ video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 32, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        1, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
         97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
-        95,
-        117, 49, 54, 11, 4, 4, 12, 2, 2, 16, 2, 20, 4, 154, 32, 4,
-        120, 0, 32, 24, 2, 0,
+        52,
+        95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 12, 1, 1, 12,
+        1, 1, 12, 1, 1, 16, 2, 16, 2, 16, 2, 16, 2, 20, 2, 20,
+        2, 150, 32, 4, 89, 32, 32, 24, 150, 33, 5, 89, 33, 33, 25, 70,
+        32, 32, 33, 150, 33, 6, 89, 33, 33, 26, 70, 32, 32, 33, 150, 33,
+        7, 89, 33, 33, 27, 70, 0, 32, 33, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u16);
+          _backup_video_orc_resample_v_multaps4_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_multaps_u16");
+      orc_program_set_name (p, "video_orc_resample_v_multaps4_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u16);
-      orc_program_add_destination (p, 4, "d1");
-      orc_program_add_source (p, 2, "s1");
+          _backup_video_orc_resample_v_multaps4_u8_lq);
+      orc_program_add_destination (p, 2, "d1");
+      orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 1, "s4");
       orc_program_add_parameter (p, 2, "p1");
-      orc_program_add_temporary (p, 4, "t1");
+      orc_program_add_parameter (p, 2, "p2");
+      orc_program_add_parameter (p, 2, "p3");
+      orc_program_add_parameter (p, 2, "p4");
+      orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
 
-      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulll", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_P1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P3,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S4, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_T2,
           ORC_VAR_D1);
 #endif
 
@@ -20303,7 +21650,13 @@ video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
   ex->params[ORC_VAR_P1] = p1;
+  ex->params[ORC_VAR_P2] = p2;
+  ex->params[ORC_VAR_P3] = p3;
+  ex->params[ORC_VAR_P4] = p4;
 
   func = c->exec;
   func (ex);
@@ -20311,92 +21664,86 @@ video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_muladdtaps_u16 */
+/* video_orc_resample_v_muladdtaps_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   int i;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var33;
   orc_union16 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
-  orc_union32 var38;
-  orc_union32 var39;
-  orc_union32 var40;
+  orc_union16 var36;
+  orc_union16 var37;
+  orc_union16 var38;
 
-  ptr0 = (orc_union32 *) d1;
-  ptr4 = (orc_union16 *) s1;
+  ptr0 = (orc_union16 *) d1;
+  ptr4 = (orc_int8 *) s1;
 
   /* 2: loadpw */
-  var35.i = p1;
+  var34.i = p1;
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var34 = ptr4[i];
-    /* 1: convuwl */
-    var38.i = (orc_uint16) var34.i;
-    /* 3: convswl */
-    var39.i = var35.i;
-    /* 4: mulll */
-    var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
-    /* 5: loadl */
-    var36 = ptr0[i];
-    /* 6: addl */
-    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
-    /* 7: storel */
-    ptr0[i] = var37;
+    /* 0: loadb */
+    var33 = ptr4[i];
+    /* 1: convubw */
+    var37.i = (orc_uint8) var33;
+    /* 3: mullw */
+    var38.i = (var37.i * var34.i) & 0xffff;
+    /* 4: loadw */
+    var35 = ptr0[i];
+    /* 5: addw */
+    var36.i = var35.i + var38.i;
+    /* 6: storew */
+    ptr0[i] = var36;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_muladdtaps_u16 (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_muladdtaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union32 *ORC_RESTRICT ptr0;
-  const orc_union16 *ORC_RESTRICT ptr4;
+  orc_union16 *ORC_RESTRICT ptr0;
+  const orc_int8 *ORC_RESTRICT ptr4;
+  orc_int8 var33;
   orc_union16 var34;
   orc_union16 var35;
-  orc_union32 var36;
-  orc_union32 var37;
-  orc_union32 var38;
-  orc_union32 var39;
-  orc_union32 var40;
+  orc_union16 var36;
+  orc_union16 var37;
+  orc_union16 var38;
 
-  ptr0 = (orc_union32 *) ex->arrays[0];
-  ptr4 = (orc_union16 *) ex->arrays[4];
+  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr4 = (orc_int8 *) ex->arrays[4];
 
   /* 2: loadpw */
-  var35.i = ex->params[24];
+  var34.i = ex->params[24];
 
   for (i = 0; i < n; i++) {
-    /* 0: loadw */
-    var34 = ptr4[i];
-    /* 1: convuwl */
-    var38.i = (orc_uint16) var34.i;
-    /* 3: convswl */
-    var39.i = var35.i;
-    /* 4: mulll */
-    var40.i = (((orc_uint32) var38.i) * ((orc_uint32) var39.i)) & 0xffffffff;
-    /* 5: loadl */
-    var36 = ptr0[i];
-    /* 6: addl */
-    var37.i = ((orc_uint32) var36.i) + ((orc_uint32) var40.i);
-    /* 7: storel */
-    ptr0[i] = var37;
+    /* 0: loadb */
+    var33 = ptr4[i];
+    /* 1: convubw */
+    var37.i = (orc_uint8) var33;
+    /* 3: mullw */
+    var38.i = (var37.i * var34.i) & 0xffff;
+    /* 4: loadw */
+    var35 = ptr0[i];
+    /* 5: addw */
+    var36.i = var35.i + var38.i;
+    /* 6: storew */
+    ptr0[i] = var36;
   }
 
 }
 
 void
-video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
-    const guint64 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, int p1, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -20410,34 +21757,30 @@ video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 35, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        1, 9, 37, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
         97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
         97,
-        112, 115, 95, 117, 49, 54, 11, 4, 4, 12, 2, 2, 16, 2, 20, 4,
-        20, 4, 154, 32, 4, 153, 33, 24, 120, 32, 32, 33, 103, 0, 0, 32,
-        2, 0,
+        112, 115, 95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 16, 2,
+        20, 2, 150, 32, 4, 89, 32, 32, 24, 70, 0, 0, 32, 2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u16);
+          _backup_video_orc_resample_v_muladdtaps_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u16");
+      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u16);
-      orc_program_add_destination (p, 4, "d1");
-      orc_program_add_source (p, 2, "s1");
+          _backup_video_orc_resample_v_muladdtaps_u8_lq);
+      orc_program_add_destination (p, 2, "d1");
+      orc_program_add_source (p, 1, "s1");
       orc_program_add_parameter (p, 2, "p1");
-      orc_program_add_temporary (p, 4, "t1");
-      orc_program_add_temporary (p, 4, "t2");
+      orc_program_add_temporary (p, 2, "t1");
 
-      orc_program_append_2 (p, "convuwl", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
-          ORC_VAR_D1);
-      orc_program_append_2 (p, "convswl", 0, ORC_VAR_T2, ORC_VAR_P1, ORC_VAR_D1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mulll", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "addl", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
           ORC_VAR_D1);
 #endif
 
@@ -20462,74 +21805,192 @@ video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_multaps_u8_lq */
+/* video_orc_resample_v_muladdtaps4_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n)
 {
   int i;
   orc_union16 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union16 var36;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+  orc_union16 var54;
 
   ptr0 = (orc_union16 *) d1;
   ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_int8 *) s4;
 
   /* 2: loadpw */
-  var34.i = p1;
+  var35.i = p1;
+  /* 6: loadpw */
+  var37.i = p2;
+  /* 11: loadpw */
+  var39.i = p3;
+  /* 16: loadpw */
+  var41.i = p4;
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var33 = ptr4[i];
+    var34 = ptr4[i];
     /* 1: convubw */
-    var36.i = (orc_uint8) var33;
+    var44.i = (orc_uint8) var34;
     /* 3: mullw */
-    var35.i = (var36.i * var34.i) & 0xffff;
-    /* 4: storew */
-    ptr0[i] = var35;
+    var45.i = (var44.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var46.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var47.i = (var46.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var48.i = var45.i + var47.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var49.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var50.i = (var49.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var51.i = var48.i + var50.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var52.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var53.i = (var52.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var54.i = var51.i + var53.i;
+    /* 19: loadw */
+    var42 = ptr0[i];
+    /* 20: addw */
+    var43.i = var42.i + var54.i;
+    /* 21: storew */
+    ptr0[i] = var43;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_multaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_muladdtaps4_u8_lq (OrcExecutor * ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
   orc_union16 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union16 var36;
+  orc_int8 var36;
+  orc_union16 var37;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+  orc_union16 var43;
+  orc_union16 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+  orc_union16 var54;
 
   ptr0 = (orc_union16 *) ex->arrays[0];
   ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_int8 *) ex->arrays[7];
 
   /* 2: loadpw */
-  var34.i = ex->params[24];
+  var35.i = ex->params[24];
+  /* 6: loadpw */
+  var37.i = ex->params[25];
+  /* 11: loadpw */
+  var39.i = ex->params[26];
+  /* 16: loadpw */
+  var41.i = ex->params[27];
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var33 = ptr4[i];
+    var34 = ptr4[i];
     /* 1: convubw */
-    var36.i = (orc_uint8) var33;
+    var44.i = (orc_uint8) var34;
     /* 3: mullw */
-    var35.i = (var36.i * var34.i) & 0xffff;
-    /* 4: storew */
-    ptr0[i] = var35;
+    var45.i = (var44.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var46.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var47.i = (var46.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var48.i = var45.i + var47.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var49.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var50.i = (var49.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var51.i = var48.i + var50.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var52.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var53.i = (var52.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var54.i = var51.i + var53.i;
+    /* 19: loadw */
+    var42 = ptr0[i];
+    /* 20: addw */
+    var43.i = var42.i + var54.i;
+    /* 21: storew */
+    ptr0[i] = var43;
   }
 
 }
 
 void
-video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdtaps4_u8_lq (gint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1,
+    int p2, int p3, int p4, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -20543,28 +22004,59 @@ video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 34, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 116, 97, 112, 115,
-        95,
-        117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 16, 2, 20, 2, 150,
-        32, 4, 89, 0, 32, 24, 2, 0,
+        1, 9, 38, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
+        97,
+        112, 115, 52, 95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 12,
+        1, 1, 12, 1, 1, 12, 1, 1, 16, 2, 16, 2, 16, 2, 16, 2,
+        20, 2, 20, 2, 150, 32, 4, 89, 32, 32, 24, 150, 33, 5, 89, 33,
+        33, 25, 70, 32, 32, 33, 150, 33, 6, 89, 33, 33, 26, 70, 32, 32,
+        33, 150, 33, 7, 89, 33, 33, 27, 70, 32, 32, 33, 70, 0, 0, 32,
+        2, 0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u8_lq);
+          _backup_video_orc_resample_v_muladdtaps4_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_multaps_u8_lq");
+      orc_program_set_name (p, "video_orc_resample_v_muladdtaps4_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_multaps_u8_lq);
+          _backup_video_orc_resample_v_muladdtaps4_u8_lq);
       orc_program_add_destination (p, 2, "d1");
       orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 1, "s4");
       orc_program_add_parameter (p, 2, "p1");
+      orc_program_add_parameter (p, 2, "p2");
+      orc_program_add_parameter (p, 2, "p3");
+      orc_program_add_parameter (p, 2, "p4");
       orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
 
       orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "mullw", 0, ORC_VAR_D1, ORC_VAR_T1, ORC_VAR_P1,
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_P1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P3,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S4, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
           ORC_VAR_D1);
 #endif
 
@@ -20581,7 +22073,13 @@ video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
   ex->params[ORC_VAR_P1] = p1;
+  ex->params[ORC_VAR_P2] = p2;
+  ex->params[ORC_VAR_P3] = p3;
+  ex->params[ORC_VAR_P4] = p4;
 
   func = c->exec;
   func (ex);
@@ -20589,86 +22087,229 @@ video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1,
 #endif
 
 
-/* video_orc_resample_v_muladdtaps_u8_lq */
+/* video_orc_resample_v_muladdscaletaps4_u8_lq */
 #ifdef DISABLE_ORC
 void
-video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdscaletaps4_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4,
+    const gint32 * ORC_RESTRICT s5, int p1, int p2, int p3, int p4, int n)
 {
   int i;
-  orc_union16 *ORC_RESTRICT ptr0;
+  orc_int8 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union16 var36;
+  orc_int8 var36;
   orc_union16 var37;
-  orc_union16 var38;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var43;
+#else
+  orc_union16 var43;
+#endif
+  orc_int8 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+  orc_union16 var54;
+  orc_union16 var55;
+  orc_union16 var56;
+  orc_union16 var57;
+  orc_union16 var58;
 
-  ptr0 = (orc_union16 *) d1;
+  ptr0 = (orc_int8 *) d1;
   ptr4 = (orc_int8 *) s1;
+  ptr5 = (orc_int8 *) s2;
+  ptr6 = (orc_int8 *) s3;
+  ptr7 = (orc_int8 *) s4;
+  ptr8 = (orc_union16 *) s5;
 
   /* 2: loadpw */
-  var34.i = p1;
+  var35.i = p1;
+  /* 6: loadpw */
+  var37.i = p2;
+  /* 11: loadpw */
+  var39.i = p3;
+  /* 16: loadpw */
+  var41.i = p4;
+  /* 21: loadpw */
+  var43.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var33 = ptr4[i];
+    var34 = ptr4[i];
     /* 1: convubw */
-    var37.i = (orc_uint8) var33;
+    var45.i = (orc_uint8) var34;
     /* 3: mullw */
-    var38.i = (var37.i * var34.i) & 0xffff;
-    /* 4: loadw */
-    var35 = ptr0[i];
-    /* 5: addw */
-    var36.i = var35.i + var38.i;
-    /* 6: storew */
-    ptr0[i] = var36;
+    var46.i = (var45.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var47.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var48.i = (var47.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var49.i = var46.i + var48.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var50.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var51.i = (var50.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var52.i = var49.i + var51.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var53.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var54.i = (var53.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var55.i = var52.i + var54.i;
+    /* 19: loadw */
+    var42 = ptr8[i];
+    /* 20: addw */
+    var56.i = var55.i + var42.i;
+    /* 22: addw */
+    var57.i = var56.i + var43.i;
+    /* 23: shrsw */
+    var58.i = var57.i >> 6;
+    /* 24: convsuswb */
+    var44 = ORC_CLAMP_UB (var58.i);
+    /* 25: storeb */
+    ptr0[i] = var44;
   }
 
 }
 
 #else
 static void
-_backup_video_orc_resample_v_muladdtaps_u8_lq (OrcExecutor * ORC_RESTRICT ex)
+_backup_video_orc_resample_v_muladdscaletaps4_u8_lq (OrcExecutor *
+    ORC_RESTRICT ex)
 {
   int i;
   int n = ex->n;
-  orc_union16 *ORC_RESTRICT ptr0;
+  orc_int8 *ORC_RESTRICT ptr0;
   const orc_int8 *ORC_RESTRICT ptr4;
-  orc_int8 var33;
-  orc_union16 var34;
+  const orc_int8 *ORC_RESTRICT ptr5;
+  const orc_int8 *ORC_RESTRICT ptr6;
+  const orc_int8 *ORC_RESTRICT ptr7;
+  const orc_union16 *ORC_RESTRICT ptr8;
+  orc_int8 var34;
   orc_union16 var35;
-  orc_union16 var36;
+  orc_int8 var36;
   orc_union16 var37;
-  orc_union16 var38;
+  orc_int8 var38;
+  orc_union16 var39;
+  orc_int8 var40;
+  orc_union16 var41;
+  orc_union16 var42;
+#if defined(__APPLE__) && __GNUC__ == 4 && __GNUC_MINOR__ == 2 && defined (__i386__)
+  volatile orc_union16 var43;
+#else
+  orc_union16 var43;
+#endif
+  orc_int8 var44;
+  orc_union16 var45;
+  orc_union16 var46;
+  orc_union16 var47;
+  orc_union16 var48;
+  orc_union16 var49;
+  orc_union16 var50;
+  orc_union16 var51;
+  orc_union16 var52;
+  orc_union16 var53;
+  orc_union16 var54;
+  orc_union16 var55;
+  orc_union16 var56;
+  orc_union16 var57;
+  orc_union16 var58;
 
-  ptr0 = (orc_union16 *) ex->arrays[0];
+  ptr0 = (orc_int8 *) ex->arrays[0];
   ptr4 = (orc_int8 *) ex->arrays[4];
+  ptr5 = (orc_int8 *) ex->arrays[5];
+  ptr6 = (orc_int8 *) ex->arrays[6];
+  ptr7 = (orc_int8 *) ex->arrays[7];
+  ptr8 = (orc_union16 *) ex->arrays[8];
 
   /* 2: loadpw */
-  var34.i = ex->params[24];
+  var35.i = ex->params[24];
+  /* 6: loadpw */
+  var37.i = ex->params[25];
+  /* 11: loadpw */
+  var39.i = ex->params[26];
+  /* 16: loadpw */
+  var41.i = ex->params[27];
+  /* 21: loadpw */
+  var43.i = (int) 0x00000020;   /* 32 or 1.58101e-322f */
 
   for (i = 0; i < n; i++) {
     /* 0: loadb */
-    var33 = ptr4[i];
+    var34 = ptr4[i];
     /* 1: convubw */
-    var37.i = (orc_uint8) var33;
+    var45.i = (orc_uint8) var34;
     /* 3: mullw */
-    var38.i = (var37.i * var34.i) & 0xffff;
-    /* 4: loadw */
-    var35 = ptr0[i];
-    /* 5: addw */
-    var36.i = var35.i + var38.i;
-    /* 6: storew */
-    ptr0[i] = var36;
+    var46.i = (var45.i * var35.i) & 0xffff;
+    /* 4: loadb */
+    var36 = ptr5[i];
+    /* 5: convubw */
+    var47.i = (orc_uint8) var36;
+    /* 7: mullw */
+    var48.i = (var47.i * var37.i) & 0xffff;
+    /* 8: addw */
+    var49.i = var46.i + var48.i;
+    /* 9: loadb */
+    var38 = ptr6[i];
+    /* 10: convubw */
+    var50.i = (orc_uint8) var38;
+    /* 12: mullw */
+    var51.i = (var50.i * var39.i) & 0xffff;
+    /* 13: addw */
+    var52.i = var49.i + var51.i;
+    /* 14: loadb */
+    var40 = ptr7[i];
+    /* 15: convubw */
+    var53.i = (orc_uint8) var40;
+    /* 17: mullw */
+    var54.i = (var53.i * var41.i) & 0xffff;
+    /* 18: addw */
+    var55.i = var52.i + var54.i;
+    /* 19: loadw */
+    var42 = ptr8[i];
+    /* 20: addw */
+    var56.i = var55.i + var42.i;
+    /* 22: addw */
+    var57.i = var56.i + var43.i;
+    /* 23: shrsw */
+    var58.i = var57.i >> 6;
+    /* 24: convsuswb */
+    var44 = ORC_CLAMP_UB (var58.i);
+    /* 25: storeb */
+    ptr0[i] = var44;
   }
 
 }
 
 void
-video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
-    const guint32 * ORC_RESTRICT s1, int p1, int n)
+video_orc_resample_v_muladdscaletaps4_u8_lq (guint32 * ORC_RESTRICT d1,
+    const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2,
+    const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4,
+    const gint32 * ORC_RESTRICT s5, int p1, int p2, int p3, int p4, int n)
 {
   OrcExecutor _ex, *ex = &_ex;
   static volatile int p_inited = 0;
@@ -20682,31 +22323,71 @@ video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
 
 #if 1
       static const orc_uint8 bc[] = {
-        1, 9, 37, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
-        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 116,
-        97,
-        112, 115, 95, 117, 56, 95, 108, 113, 11, 2, 2, 12, 1, 1, 16, 2,
-        20, 2, 150, 32, 4, 89, 32, 32, 24, 70, 0, 0, 32, 2, 0,
+        1, 9, 43, 118, 105, 100, 101, 111, 95, 111, 114, 99, 95, 114, 101, 115,
+        97, 109, 112, 108, 101, 95, 118, 95, 109, 117, 108, 97, 100, 100, 115,
+        99,
+        97, 108, 101, 116, 97, 112, 115, 52, 95, 117, 56, 95, 108, 113, 11, 1,
+        1, 12, 1, 1, 12, 1, 1, 12, 1, 1, 12, 1, 1, 12, 2, 2,
+        14, 2, 32, 0, 0, 0, 14, 2, 6, 0, 0, 0, 16, 2, 16, 2,
+        16, 2, 16, 2, 20, 2, 20, 2, 150, 32, 4, 89, 32, 32, 24, 150,
+        33, 5, 89, 33, 33, 25, 70, 32, 32, 33, 150, 33, 6, 89, 33, 33,
+        26, 70, 32, 32, 33, 150, 33, 7, 89, 33, 33, 27, 70, 32, 32, 33,
+        70, 32, 32, 8, 70, 32, 32, 16, 94, 32, 32, 17, 160, 0, 32, 2,
+        0,
       };
       p = orc_program_new_from_static_bytecode (bc);
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u8_lq);
+          _backup_video_orc_resample_v_muladdscaletaps4_u8_lq);
 #else
       p = orc_program_new ();
-      orc_program_set_name (p, "video_orc_resample_v_muladdtaps_u8_lq");
+      orc_program_set_name (p, "video_orc_resample_v_muladdscaletaps4_u8_lq");
       orc_program_set_backup_function (p,
-          _backup_video_orc_resample_v_muladdtaps_u8_lq);
-      orc_program_add_destination (p, 2, "d1");
+          _backup_video_orc_resample_v_muladdscaletaps4_u8_lq);
+      orc_program_add_destination (p, 1, "d1");
       orc_program_add_source (p, 1, "s1");
+      orc_program_add_source (p, 1, "s2");
+      orc_program_add_source (p, 1, "s3");
+      orc_program_add_source (p, 1, "s4");
+      orc_program_add_source (p, 2, "s5");
+      orc_program_add_constant (p, 2, 0x00000020, "c1");
+      orc_program_add_constant (p, 2, 0x00000006, "c2");
       orc_program_add_parameter (p, 2, "p1");
+      orc_program_add_parameter (p, 2, "p2");
+      orc_program_add_parameter (p, 2, "p3");
+      orc_program_add_parameter (p, 2, "p4");
       orc_program_add_temporary (p, 2, "t1");
+      orc_program_add_temporary (p, 2, "t2");
 
       orc_program_append_2 (p, "convubw", 0, ORC_VAR_T1, ORC_VAR_S1, ORC_VAR_D1,
           ORC_VAR_D1);
       orc_program_append_2 (p, "mullw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_P1,
           ORC_VAR_D1);
-      orc_program_append_2 (p, "addw", 0, ORC_VAR_D1, ORC_VAR_D1, ORC_VAR_T1,
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S2, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S3, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P3,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "convubw", 0, ORC_VAR_T2, ORC_VAR_S4, ORC_VAR_D1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "mullw", 0, ORC_VAR_T2, ORC_VAR_T2, ORC_VAR_P4,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_T2,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_S5,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "addw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C1,
+          ORC_VAR_D1);
+      orc_program_append_2 (p, "shrsw", 0, ORC_VAR_T1, ORC_VAR_T1, ORC_VAR_C2,
           ORC_VAR_D1);
+      orc_program_append_2 (p, "convsuswb", 0, ORC_VAR_D1, ORC_VAR_T1,
+          ORC_VAR_D1, ORC_VAR_D1);
 #endif
 
       orc_program_compile (p);
@@ -20722,7 +22403,14 @@ video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1,
   ex->n = n;
   ex->arrays[ORC_VAR_D1] = d1;
   ex->arrays[ORC_VAR_S1] = (void *) s1;
+  ex->arrays[ORC_VAR_S2] = (void *) s2;
+  ex->arrays[ORC_VAR_S3] = (void *) s3;
+  ex->arrays[ORC_VAR_S4] = (void *) s4;
+  ex->arrays[ORC_VAR_S5] = (void *) s5;
   ex->params[ORC_VAR_P1] = p1;
+  ex->params[ORC_VAR_P2] = p2;
+  ex->params[ORC_VAR_P3] = p3;
+  ex->params[ORC_VAR_P4] = p4;
 
   func = c->exec;
   func (ex);
index 5b686ff..b07b241 100644 (file)
@@ -167,6 +167,9 @@ void video_orc_resample_h_muladdtaps_u8 (gint32 * ORC_RESTRICT d1, int d1_stride
 void video_orc_resample_scaletaps_u8 (guint32 * ORC_RESTRICT d1, const gint32 * ORC_RESTRICT s1, int n);
 void video_orc_resample_h_multaps_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n);
 void video_orc_resample_h_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1, int d1_stride, const guint32 * ORC_RESTRICT s1, int s1_stride, const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m);
+void video_orc_resample_h_multaps3_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4, const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n);
+void video_orc_resample_h_muladdtaps3_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4, const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, int n);
+void video_orc_resample_h_muladdscaletaps3_u8_lq (guint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const gint16 * ORC_RESTRICT s4, const gint16 * ORC_RESTRICT s5, const gint16 * ORC_RESTRICT s6, const gint32 * ORC_RESTRICT s7, int n);
 void video_orc_resample_scaletaps_u8_lq (guint32 * ORC_RESTRICT d1, const gint32 * ORC_RESTRICT s1, int n);
 void video_orc_resample_h_multaps_u16 (gint32 * ORC_RESTRICT d1, const guint64 * ORC_RESTRICT s1, const gint16 * ORC_RESTRICT s2, int n);
 void video_orc_resample_h_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, int d1_stride, const guint64 * ORC_RESTRICT s1, int s1_stride, const gint16 * ORC_RESTRICT s2, int s2_stride, int n, int m);
@@ -176,7 +179,10 @@ void video_orc_resample_v_muladdtaps_u8 (gint32 * ORC_RESTRICT d1, const guint32
 void video_orc_resample_v_multaps_u16 (gint32 * ORC_RESTRICT d1, const guint64 * ORC_RESTRICT s1, int p1, int n);
 void video_orc_resample_v_muladdtaps_u16 (gint32 * ORC_RESTRICT d1, const guint64 * ORC_RESTRICT s1, int p1, int n);
 void video_orc_resample_v_multaps_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, int p1, int n);
+void video_orc_resample_v_multaps4_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1, int p2, int p3, int p4, int n);
 void video_orc_resample_v_muladdtaps_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, int p1, int n);
+void video_orc_resample_v_muladdtaps4_u8_lq (gint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, int p1, int p2, int p3, int p4, int n);
+void video_orc_resample_v_muladdscaletaps4_u8_lq (guint32 * ORC_RESTRICT d1, const guint32 * ORC_RESTRICT s1, const guint32 * ORC_RESTRICT s2, const guint32 * ORC_RESTRICT s3, const guint32 * ORC_RESTRICT s4, const gint32 * ORC_RESTRICT s5, int p1, int p2, int p3, int p4, int n);
 void video_orc_chroma_down_h2_u8 (guint8 * ORC_RESTRICT d1, const guint8 * ORC_RESTRICT s1, int n);
 void video_orc_chroma_down_v2_u8 (guint8 * ORC_RESTRICT d1, const guint8 * ORC_RESTRICT s1, const guint8 * ORC_RESTRICT s2, int n);
 void video_orc_chroma_up_v2_u8 (guint8 * ORC_RESTRICT d1, guint8 * ORC_RESTRICT d2, const guint8 * ORC_RESTRICT s1, const guint8 * ORC_RESTRICT s2, int n);
index 7cbae15..cd7a86c 100644 (file)
@@ -1500,7 +1500,6 @@ convsuswb d1, w1
 #convsuslw w1, l1
 #convsuswb d1, w1
 
-
 .function video_orc_resample_h_multaps_u8
 .source 1 s guint32
 .source 2 t gint16
@@ -1553,6 +1552,72 @@ convubw w1, s
 mullw w1, w1, t
 addw d, d, w1
 
+.function video_orc_resample_h_multaps3_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 2 t1 gint16
+.source 2 t2 gint16
+.source 2 t3 gint16
+.dest 2 d gint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw d, w1, w2
+
+.function video_orc_resample_h_muladdtaps3_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 2 t1 gint16
+.source 2 t2 gint16
+.source 2 t3 gint16
+.dest 2 d gint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw w1, w1, w2
+addw d, d, w1
+
+.function video_orc_resample_h_muladdscaletaps3_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 2 t1 gint16
+.source 2 t2 gint16
+.source 2 t3 gint16
+.source 2 temp gint32
+.dest 1 d guint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw w1, w1, w2
+addw w1, w1, temp
+addw w1, w1, 32
+shrsw w1, w1, 6
+convsuswb d, w1
+
 .function video_orc_resample_scaletaps_u8_lq
 .source 2 s gint32
 .dest 1 d guint32
@@ -1645,6 +1710,31 @@ addl d, d, t1
 convubw w1, s
 mullw d, w1, t
 
+.function video_orc_resample_v_multaps4_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 1 s4 guint32
+.param 2 t1 gint16
+.param 2 t2 gint16
+.param 2 t3 gint16
+.param 2 t4 gint16
+.dest 2 d gint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw w1, w1, w2
+convubw w2, s4
+mullw w2, w2, t4
+addw d, w1, w2
+
 .function video_orc_resample_v_muladdtaps_u8_lq
 .source 1 s guint32
 .param 2 t gint16
@@ -1655,6 +1745,62 @@ convubw w1, s
 mullw w1, w1, t
 addw d, d, w1
 
+.function video_orc_resample_v_muladdtaps4_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 1 s4 guint32
+.param 2 t1 gint16
+.param 2 t2 gint16
+.param 2 t3 gint16
+.param 2 t4 gint16
+.dest 2 d gint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw w1, w1, w2
+convubw w2, s4
+mullw w2, w2, t4
+addw w1, w1, w2
+addw d, d, w1
+
+.function video_orc_resample_v_muladdscaletaps4_u8_lq
+.source 1 s1 guint32
+.source 1 s2 guint32
+.source 1 s3 guint32
+.source 1 s4 guint32
+.source 2 temp gint32
+.param 2 t1 gint16
+.param 2 t2 gint16
+.param 2 t3 gint16
+.param 2 t4 gint16
+.dest 1 d guint32
+.temp 2 w1
+.temp 2 w2
+
+convubw w1, s1
+mullw w1, w1, t1
+convubw w2, s2
+mullw w2, w2, t2
+addw w1, w1, w2
+convubw w2, s3
+mullw w2, w2, t3
+addw w1, w1, w2
+convubw w2, s4
+mullw w2, w2, t4
+addw w1, w1, w2
+addw w1, w1, temp
+addw w1, w1, 32
+shrsw w1, w1, 6
+convsuswb d, w1
+
 .function video_orc_chroma_down_h2_u8
 .source 8 s guint8
 .dest 8 d guint8
index f00bf7e..c732f57 100644 (file)
@@ -459,13 +459,50 @@ video_scale_h_ntap_4u8 (GstVideoScaler * scale,
   count = width * 4;
 
 #ifdef LQ
-  /* first pixels with first tap to t4 */
-  video_orc_resample_h_multaps_u8_lq (temp, pixels, taps, count);
-  /* add other pixels with other taps to t4 */
-  video_orc_resample_h_muladdtaps_u8_lq (temp, 0, pixels + width, count,
-      taps + count, count * 2, count, max_taps - 1);
-  /* scale and write final result */
-  video_orc_resample_scaletaps_u8_lq (d, temp, count);
+  /* first pixels with first tap to temp */
+  if (max_taps > 3) {
+    video_orc_resample_h_multaps3_u8_lq (temp, pixels, pixels + width,
+        pixels + width * 2, taps, taps + count, taps + count * 2, count);
+    max_taps -= 3;
+    pixels += width * 3;
+    taps += count * 3;
+  } else {
+    gint first = max_taps % 3;
+
+    video_orc_resample_h_multaps_u8_lq (temp, pixels, taps, count);
+    video_orc_resample_h_muladdtaps_u8_lq (temp, 0, pixels + width, count,
+        taps + count, count * 2, count, first - 1);
+    max_taps -= first;
+    pixels += width * first;
+    taps += count * first;
+  }
+  while (max_taps > 3) {
+    if (max_taps >= 6) {
+      video_orc_resample_h_muladdtaps3_u8_lq (temp, pixels, pixels + width,
+          pixels + width * 2, taps, taps + count, taps + count * 2, count);
+      max_taps -= 3;
+      pixels += width * 3;
+      taps += count * 3;
+    } else {
+      video_orc_resample_h_muladdtaps_u8_lq (temp, 0, pixels, count,
+          taps, count * 2, count, max_taps - 3);
+      pixels += width * (max_taps - 3);
+      taps += count * (max_taps - 3);
+      max_taps = 3;
+    }
+  }
+  if (max_taps == 3) {
+    video_orc_resample_h_muladdscaletaps3_u8_lq (d, pixels, pixels + width,
+        pixels + width * 2, taps, taps + count, taps + count * 2, temp, count);
+  } else {
+    if (max_taps) {
+      /* add other pixels with other taps to t4 */
+      video_orc_resample_h_muladdtaps_u8_lq (temp, 0, pixels, count,
+          taps, count * 2, count, max_taps);
+    }
+    /* scale and write final result */
+    video_orc_resample_scaletaps_u8_lq (d, temp, count);
+  }
 #else
   /* first pixels with first tap to t4 */
   video_orc_resample_h_multaps_u8 (temp, pixels, taps, count);
@@ -697,12 +734,53 @@ video_scale_v_ntap_4u8 (GstVideoScaler * scale,
   count = width * 4;
 
 #ifdef LQ
-  video_orc_resample_v_multaps_u8_lq (temp, srcs[0], taps[0], count);
-  for (i = 1; i < max_taps; i++) {
-    video_orc_resample_v_muladdtaps_u8_lq (temp, srcs[i * src_inc], taps[i],
-        count);
+  if (max_taps > 4) {
+    video_orc_resample_v_multaps4_u8_lq (temp, srcs[0], srcs[1 * src_inc],
+        srcs[2 * src_inc], srcs[3 * src_inc], taps[0], taps[1], taps[2],
+        taps[3], count);
+    max_taps -= 4;
+    srcs += 4 * src_inc;
+    taps += 4;
+  } else {
+    gint first = (max_taps % 4);
+
+    video_orc_resample_v_multaps_u8_lq (temp, srcs[0], taps[0], count);
+    for (i = 1; i < first; i++) {
+      video_orc_resample_v_muladdtaps_u8_lq (temp, srcs[i * src_inc], taps[i],
+          count);
+    }
+    max_taps -= first;
+    srcs += first * src_inc;
+    taps += first;
+  }
+  while (max_taps > 4) {
+    if (max_taps >= 8) {
+      video_orc_resample_v_muladdtaps4_u8_lq (temp, srcs[0], srcs[1 * src_inc],
+          srcs[2 * src_inc], srcs[3 * src_inc], taps[0], taps[1], taps[2],
+          taps[3], count);
+      max_taps -= 4;
+      srcs += 4 * src_inc;
+      taps += 4;
+    } else {
+      for (i = 0; i < max_taps - 4; i++)
+        video_orc_resample_v_muladdtaps_u8_lq (temp, srcs[i * src_inc], taps[i],
+            count);
+      srcs += (max_taps - 4) * src_inc;
+      taps += (max_taps - 4);
+      max_taps = 4;
+    }
+  }
+  if (max_taps == 4) {
+    video_orc_resample_v_muladdscaletaps4_u8_lq (d, srcs[0], srcs[1 * src_inc],
+        srcs[2 * src_inc], srcs[3 * src_inc], temp, taps[0], taps[1], taps[2],
+        taps[3], count);
+  } else {
+    for (i = 0; i < max_taps; i++)
+      video_orc_resample_v_muladdtaps_u8_lq (temp, srcs[i * src_inc], taps[i],
+          count);
+    video_orc_resample_scaletaps_u8_lq (d, temp, count);
   }
-  video_orc_resample_scaletaps_u8_lq (d, temp, count);
+
 #else
   video_orc_resample_v_multaps_u8 (temp, srcs[0], taps[0], count);
   for (i = 1; i < max_taps; i++) {
@@ -780,6 +858,9 @@ gst_video_scaler_horizontal (GstVideoScaler * scale, GstVideoFormat format,
   if (scale->tmpwidth < width)
     realloc_tmplines (scale, width);
 
+  GST_DEBUG ("format %d, pstride %d max_taps %d", format, pstride,
+      scale->resampler.max_taps);
+
   switch (pstride) {
     case 4:
       switch (scale->resampler.max_taps) {
@@ -853,6 +934,9 @@ gst_video_scaler_vertical (GstVideoScaler * scale, GstVideoFormat format,
   if (scale->tmpwidth < width)
     realloc_tmplines (scale, width);
 
+  GST_DEBUG ("format %d, pstride %d max_taps %d", format, pstride,
+      scale->resampler.max_taps);
+
   switch (pstride) {
     case 4:
       switch (scale->resampler.max_taps) {