qtmux: fix corner case buffer handling for reorder method
[platform/upstream/gst-plugins-good.git] / ext / speex / gstspeexenc.c
index 777b75b..57dc41c 100644 (file)
@@ -1,4 +1,4 @@
-/* GStreamer
+/* GStreamer Speex Encoder
  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
  *
  * This library is free software; you can redistribute it and/or
  * Boston, MA 02111-1307, USA.
  */
 
+/**
+ * SECTION:element-speexenc
+ * @see_also: speexdec, oggmux
+ *
+ * This element encodes audio as a Speex stream.
+ * <ulink url="http://www.speex.org/">Speex</ulink> is a royalty-free
+ * audio codec maintained by the <ulink url="http://www.xiph.org/">Xiph.org
+ * Foundation</ulink>.
+ *
+ * <refsect2>
+ * <title>Example pipelines</title>
+ * |[
+ * gst-launch audiotestsrc num-buffers=100 ! speexenc ! oggmux ! filesink location=beep.ogg
+ * ]| Encode an Ogg/Speex file.
+ * </refsect2>
+ */
 
 #ifdef HAVE_CONFIG_H
 #include "config.h"
 
 #include <gst/gsttagsetter.h>
 #include <gst/tag/tag.h>
+#include <gst/audio/audio.h>
 #include "gstspeexenc.h"
 
-GST_DEBUG_CATEGORY (speexenc_debug);
+GST_DEBUG_CATEGORY_STATIC (speexenc_debug);
 #define GST_CAT_DEFAULT speexenc_debug
 
-static GstPadTemplate *gst_speexenc_src_template, *gst_speexenc_sink_template;
+static GstStaticPadTemplate sink_factory = GST_STATIC_PAD_TEMPLATE ("sink",
+    GST_PAD_SINK,
+    GST_PAD_ALWAYS,
+    GST_STATIC_CAPS ("audio/x-raw-int, "
+        "rate = (int) [ 6000, 48000 ], "
+        "channels = (int) [ 1, 2 ], "
+        "endianness = (int) BYTE_ORDER, "
+        "signed = (boolean) TRUE, " "width = (int) 16, " "depth = (int) 16")
+    );
+
+static GstStaticPadTemplate src_factory = GST_STATIC_PAD_TEMPLATE ("src",
+    GST_PAD_SRC,
+    GST_PAD_ALWAYS,
+    GST_STATIC_CAPS ("audio/x-speex, "
+        "rate = (int) [ 6000, 48000 ], " "channels = (int) [ 1, 2]")
+    );
+
+#define DEFAULT_QUALITY         8.0
+#define DEFAULT_BITRATE         0
+#define DEFAULT_MODE            GST_SPEEX_ENC_MODE_AUTO
+#define DEFAULT_VBR             FALSE
+#define DEFAULT_ABR             0
+#define DEFAULT_VAD             FALSE
+#define DEFAULT_DTX             FALSE
+#define DEFAULT_COMPLEXITY      3
+#define DEFAULT_NFRAMES         1
 
-/* elementfactory information */
-GstElementDetails speexenc_details = {
-  "Speex encoder",
-  "Codec/Encoder/Audio",
-  "Encodes audio in Speex format",
-  "Wim Taymans <wim@fluendo.com>",
-};
-
-/* GstSpeexEnc signals and args */
 enum
 {
-  /* FILL ME */
-  LAST_SIGNAL
+  PROP_0,
+  PROP_QUALITY,
+  PROP_BITRATE,
+  PROP_MODE,
+  PROP_VBR,
+  PROP_ABR,
+  PROP_VAD,
+  PROP_DTX,
+  PROP_COMPLEXITY,
+  PROP_NFRAMES,
+  PROP_LAST_MESSAGE
 };
 
-#define DEFAULT_QUALITY                8.0
-#define DEFAULT_BITRATE                0
-#define DEFAULT_VBR            FALSE
-#define DEFAULT_ABR            0
-#define DEFAULT_VAD            FALSE
-#define DEFAULT_DTX            FALSE
-#define DEFAULT_COMPLEXITY     3
-#define DEFAULT_NFRAMES                1
-
-enum
+#define GST_TYPE_SPEEX_ENC_MODE (gst_speex_enc_mode_get_type())
+static GType
+gst_speex_enc_mode_get_type (void)
 {
-  ARG_0,
-  ARG_QUALITY,
-  ARG_BITRATE,
-  ARG_VBR,
-  ARG_ABR,
-  ARG_VAD,
-  ARG_DTX,
-  ARG_COMPLEXITY,
-  ARG_NFRAMES,
-  ARG_LAST_MESSAGE
-};
+  static GType speex_enc_mode_type = 0;
+  static const GEnumValue speex_enc_modes[] = {
+    {GST_SPEEX_ENC_MODE_AUTO, "Auto", "auto"},
+    {GST_SPEEX_ENC_MODE_UWB, "Ultra Wide Band", "uwb"},
+    {GST_SPEEX_ENC_MODE_WB, "Wide Band", "wb"},
+    {GST_SPEEX_ENC_MODE_NB, "Narrow Band", "nb"},
+    {0, NULL, NULL},
+  };
+  if (G_UNLIKELY (speex_enc_mode_type == 0)) {
+    speex_enc_mode_type = g_enum_register_static ("GstSpeexEncMode",
+        speex_enc_modes);
+  }
+  return speex_enc_mode_type;
+}
 
 #if 0
 static const GstFormat *
-gst_speexenc_get_formats (GstPad * pad)
+gst_speex_enc_get_formats (GstPad * pad)
 {
   static const GstFormat src_formats[] = {
     GST_FORMAT_BYTES,
@@ -95,99 +133,58 @@ gst_speexenc_get_formats (GstPad * pad)
 }
 #endif
 
-static void gst_speexenc_base_init (gpointer g_class);
-static void gst_speexenc_class_init (GstSpeexEncClass * klass);
-static void gst_speexenc_init (GstSpeexEnc * speexenc);
+static void gst_speex_enc_finalize (GObject * object);
 
-static gboolean gst_speexenc_sinkevent (GstPad * pad, GstEvent * event);
-static GstFlowReturn gst_speexenc_chain (GstPad * pad, GstBuffer * buf);
-static gboolean gst_speexenc_setup (GstSpeexEnc * speexenc);
+static gboolean gst_speex_enc_sinkevent (GstPad * pad, GstEvent * event);
+static GstFlowReturn gst_speex_enc_chain (GstPad * pad, GstBuffer * buf);
+static gboolean gst_speex_enc_setup (GstSpeexEnc * enc);
 
-static void gst_speexenc_get_property (GObject * object, guint prop_id,
+static void gst_speex_enc_get_property (GObject * object, guint prop_id,
     GValue * value, GParamSpec * pspec);
-static void gst_speexenc_set_property (GObject * object, guint prop_id,
+static void gst_speex_enc_set_property (GObject * object, guint prop_id,
     const GValue * value, GParamSpec * pspec);
-static GstStateChangeReturn gst_speexenc_change_state (GstElement * element,
+static GstStateChangeReturn gst_speex_enc_change_state (GstElement * element,
     GstStateChange transition);
 
-static GstElementClass *parent_class = NULL;
+static GstFlowReturn gst_speex_enc_encode (GstSpeexEnc * enc, gboolean flush);
 
-/*static guint gst_speexenc_signals[LAST_SIGNAL] = { 0 }; */
-
-GType
-gst_speexenc_get_type (void)
+static void
+gst_speex_enc_setup_interfaces (GType speexenc_type)
 {
-  static GType speexenc_type = 0;
-
-  if (!speexenc_type) {
-    static const GTypeInfo speexenc_info = {
-      sizeof (GstSpeexEncClass),
-      gst_speexenc_base_init,
-      NULL,
-      (GClassInitFunc) gst_speexenc_class_init,
-      NULL,
-      NULL,
-      sizeof (GstSpeexEnc),
-      0,
-      (GInstanceInitFunc) gst_speexenc_init,
-    };
-    static const GInterfaceInfo tag_setter_info = {
-      NULL,
-      NULL,
-      NULL
-    };
-
-    speexenc_type =
-        g_type_register_static (GST_TYPE_ELEMENT, "GstSpeexEnc", &speexenc_info,
-        0);
-
-    g_type_add_interface_static (speexenc_type, GST_TYPE_TAG_SETTER,
-        &tag_setter_info);
-
-    GST_DEBUG_CATEGORY_INIT (speexenc_debug, "speexenc", 0, "Speex encoder");
-  }
-  return speexenc_type;
-}
+  static const GInterfaceInfo tag_setter_info = { NULL, NULL, NULL };
+  const GInterfaceInfo preset_interface_info = {
+    NULL,                       /* interface_init */
+    NULL,                       /* interface_finalize */
+    NULL                        /* interface_data */
+  };
 
-static GstCaps *
-speex_caps_factory (void)
-{
-  return gst_caps_new_simple ("audio/x-speex", NULL);
-}
+  g_type_add_interface_static (speexenc_type, GST_TYPE_TAG_SETTER,
+      &tag_setter_info);
+  g_type_add_interface_static (speexenc_type, GST_TYPE_PRESET,
+      &preset_interface_info);
 
-static GstCaps *
-raw_caps_factory (void)
-{
-  return
-      gst_caps_new_simple ("audio/x-raw-int",
-      "rate", GST_TYPE_INT_RANGE, 6000, 48000,
-      "channels", GST_TYPE_INT_RANGE, 1, 2,
-      "endianness", G_TYPE_INT, G_BYTE_ORDER,
-      "signed", G_TYPE_BOOLEAN, TRUE,
-      "width", G_TYPE_INT, 16, "depth", G_TYPE_INT, 16, NULL);
+  GST_DEBUG_CATEGORY_INIT (speexenc_debug, "speexenc", 0, "Speex encoder");
 }
 
+GST_BOILERPLATE_FULL (GstSpeexEnc, gst_speex_enc, GstElement, GST_TYPE_ELEMENT,
+    gst_speex_enc_setup_interfaces);
+
 static void
-gst_speexenc_base_init (gpointer g_class)
+gst_speex_enc_base_init (gpointer g_class)
 {
   GstElementClass *element_class = GST_ELEMENT_CLASS (g_class);
-  GstCaps *raw_caps, *speex_caps;
-
-  raw_caps = raw_caps_factory ();
-  speex_caps = speex_caps_factory ();
 
-  gst_speexenc_sink_template = gst_pad_template_new ("sink", GST_PAD_SINK,
-      GST_PAD_ALWAYS, raw_caps);
-  gst_speexenc_src_template = gst_pad_template_new ("src", GST_PAD_SRC,
-      GST_PAD_ALWAYS, speex_caps);
   gst_element_class_add_pad_template (element_class,
-      gst_speexenc_sink_template);
-  gst_element_class_add_pad_template (element_class, gst_speexenc_src_template);
-  gst_element_class_set_details (element_class, &speexenc_details);
+      gst_static_pad_template_get (&src_factory));
+  gst_element_class_add_pad_template (element_class,
+      gst_static_pad_template_get (&sink_factory));
+  gst_element_class_set_details_simple (element_class, "Speex audio encoder",
+      "Codec/Encoder/Audio",
+      "Encodes audio in Speex format", "Wim Taymans <wim@fluendo.com>");
 }
 
 static void
-gst_speexenc_class_init (GstSpeexEncClass * klass)
+gst_speex_enc_class_init (GstSpeexEncClass * klass)
 {
   GObjectClass *gobject_class;
   GstElementClass *gstelement_class;
@@ -195,82 +192,138 @@ gst_speexenc_class_init (GstSpeexEncClass * klass)
   gobject_class = (GObjectClass *) klass;
   gstelement_class = (GstElementClass *) klass;
 
-  gobject_class->set_property = gst_speexenc_set_property;
-  gobject_class->get_property = gst_speexenc_get_property;
+  gobject_class->set_property = gst_speex_enc_set_property;
+  gobject_class->get_property = gst_speex_enc_get_property;
 
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_QUALITY,
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_QUALITY,
       g_param_spec_float ("quality", "Quality", "Encoding quality",
-          0.0, 10.0, DEFAULT_QUALITY, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_BITRATE,
+          0.0, 10.0, DEFAULT_QUALITY,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_BITRATE,
       g_param_spec_int ("bitrate", "Encoding Bit-rate",
           "Specify an encoding bit-rate (in bps). (0 = automatic)",
-          0, G_MAXINT, DEFAULT_BITRATE, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_VBR,
+          0, G_MAXINT, DEFAULT_BITRATE,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (gobject_class, PROP_MODE,
+      g_param_spec_enum ("mode", "Mode", "The encoding mode",
+          GST_TYPE_SPEEX_ENC_MODE, GST_SPEEX_ENC_MODE_AUTO,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_VBR,
       g_param_spec_boolean ("vbr", "VBR",
-          "Enable variable bit-rate", DEFAULT_VBR, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_ABR,
+          "Enable variable bit-rate", DEFAULT_VBR,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_ABR,
       g_param_spec_int ("abr", "ABR",
           "Enable average bit-rate (0 = disabled)",
-          0, G_MAXINT, DEFAULT_ABR, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_VAD,
+          0, G_MAXINT, DEFAULT_ABR,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_VAD,
       g_param_spec_boolean ("vad", "VAD",
-          "Enable voice activity detection", DEFAULT_VAD, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_DTX,
+          "Enable voice activity detection", DEFAULT_VAD,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_DTX,
       g_param_spec_boolean ("dtx", "DTX",
-          "Enable discontinuous transmission", DEFAULT_DTX, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_COMPLEXITY,
+          "Enable discontinuous transmission", DEFAULT_DTX,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_COMPLEXITY,
       g_param_spec_int ("complexity", "Complexity",
           "Set encoding complexity",
-          0, G_MAXINT, DEFAULT_COMPLEXITY, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_NFRAMES,
+          0, G_MAXINT, DEFAULT_COMPLEXITY,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_NFRAMES,
       g_param_spec_int ("nframes", "NFrames",
           "Number of frames per buffer",
-          0, G_MAXINT, DEFAULT_NFRAMES, G_PARAM_READWRITE));
-  g_object_class_install_property (G_OBJECT_CLASS (klass), ARG_LAST_MESSAGE,
+          0, G_MAXINT, DEFAULT_NFRAMES,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
+  g_object_class_install_property (G_OBJECT_CLASS (klass), PROP_LAST_MESSAGE,
       g_param_spec_string ("last-message", "last-message",
-          "The last status message", NULL, G_PARAM_READABLE));
+          "The last status message", NULL,
+          G_PARAM_READABLE | G_PARAM_STATIC_STRINGS));
 
-  parent_class = g_type_class_ref (GST_TYPE_ELEMENT);
+  gobject_class->finalize = gst_speex_enc_finalize;
 
-  gstelement_class->change_state = gst_speexenc_change_state;
+  gstelement_class->change_state =
+      GST_DEBUG_FUNCPTR (gst_speex_enc_change_state);
+}
+
+static void
+gst_speex_enc_finalize (GObject * object)
+{
+  GstSpeexEnc *enc;
+
+  enc = GST_SPEEX_ENC (object);
+
+  g_free (enc->last_message);
+  g_object_unref (enc->adapter);
+
+  G_OBJECT_CLASS (parent_class)->finalize (object);
 }
 
 static gboolean
-gst_speexenc_sink_setcaps (GstPad * pad, GstCaps * caps)
+gst_speex_enc_sink_setcaps (GstPad * pad, GstCaps * caps)
 {
-  GstSpeexEnc *speexenc;
+  GstSpeexEnc *enc;
   GstStructure *structure;
 
-  speexenc = GST_SPEEXENC (GST_PAD_PARENT (pad));
-  speexenc->setup = FALSE;
+  enc = GST_SPEEX_ENC (GST_PAD_PARENT (pad));
+  enc->setup = FALSE;
 
   structure = gst_caps_get_structure (caps, 0);
-  gst_structure_get_int (structure, "channels", &speexenc->channels);
-  gst_structure_get_int (structure, "rate", &speexenc->rate);
+  gst_structure_get_int (structure, "channels", &enc->channels);
+  gst_structure_get_int (structure, "rate", &enc->rate);
 
-  gst_speexenc_setup (speexenc);
+  gst_speex_enc_setup (enc);
 
-  if (speexenc->setup)
-    return TRUE;
+  return enc->setup;
+}
 
-  return FALSE;
+
+static GstCaps *
+gst_speex_enc_sink_getcaps (GstPad * pad)
+{
+  GstCaps *caps = gst_caps_copy (gst_pad_get_pad_template_caps (pad));
+  GstCaps *peercaps = NULL;
+  GstSpeexEnc *enc = GST_SPEEX_ENC (gst_pad_get_parent_element (pad));
+
+  peercaps = gst_pad_peer_get_caps (enc->srcpad);
+
+  if (peercaps) {
+    if (!gst_caps_is_empty (peercaps) && !gst_caps_is_any (peercaps)) {
+      GstStructure *ps = gst_caps_get_structure (peercaps, 0);
+      GstStructure *s = gst_caps_get_structure (caps, 0);
+      gint rate, channels;
+
+      if (gst_structure_get_int (ps, "rate", &rate)) {
+        gst_structure_fixate_field_nearest_int (s, "rate", rate);
+      }
+
+      if (gst_structure_get_int (ps, "channels", &channels)) {
+        gst_structure_fixate_field_nearest_int (s, "channels", channels);
+      }
+    }
+    gst_caps_unref (peercaps);
+  }
+
+  gst_object_unref (enc);
+
+  return caps;
 }
 
+
 static gboolean
-gst_speexenc_convert_src (GstPad * pad, GstFormat src_format, gint64 src_value,
+gst_speex_enc_convert_src (GstPad * pad, GstFormat src_format, gint64 src_value,
     GstFormat * dest_format, gint64 * dest_value)
 {
   gboolean res = TRUE;
-  GstSpeexEnc *speexenc;
+  GstSpeexEnc *enc;
   gint64 avg;
 
-  speexenc = GST_SPEEXENC (GST_PAD_PARENT (pad));
+  enc = GST_SPEEX_ENC (GST_PAD_PARENT (pad));
 
-  if (speexenc->samples_in == 0 ||
-      speexenc->bytes_out == 0 || speexenc->rate == 0)
+  if (enc->samples_in == 0 || enc->bytes_out == 0 || enc->rate == 0)
     return FALSE;
 
-  avg = (speexenc->bytes_out * speexenc->rate) / (speexenc->samples_in);
+  avg = (enc->bytes_out * enc->rate) / (enc->samples_in);
 
   switch (src_format) {
     case GST_FORMAT_BYTES:
@@ -298,17 +351,17 @@ gst_speexenc_convert_src (GstPad * pad, GstFormat src_format, gint64 src_value,
 }
 
 static gboolean
-gst_speexenc_convert_sink (GstPad * pad, GstFormat src_format,
+gst_speex_enc_convert_sink (GstPad * pad, GstFormat src_format,
     gint64 src_value, GstFormat * dest_format, gint64 * dest_value)
 {
   gboolean res = TRUE;
   guint scale = 1;
   gint bytes_per_sample;
-  GstSpeexEnc *speexenc;
+  GstSpeexEnc *enc;
 
-  speexenc = GST_SPEEXENC (GST_PAD_PARENT (pad));
+  enc = GST_SPEEX_ENC (GST_PAD_PARENT (pad));
 
-  bytes_per_sample = speexenc->channels * 2;
+  bytes_per_sample = enc->channels * 2;
 
   switch (src_format) {
     case GST_FORMAT_BYTES:
@@ -320,7 +373,7 @@ gst_speexenc_convert_sink (GstPad * pad, GstFormat src_format,
           break;
         case GST_FORMAT_TIME:
         {
-          gint byterate = bytes_per_sample * speexenc->rate;
+          gint byterate = bytes_per_sample * enc->rate;
 
           if (byterate == 0)
             return FALSE;
@@ -337,9 +390,9 @@ gst_speexenc_convert_sink (GstPad * pad, GstFormat src_format,
           *dest_value = src_value * bytes_per_sample;
           break;
         case GST_FORMAT_TIME:
-          if (speexenc->rate == 0)
+          if (enc->rate == 0)
             return FALSE;
-          *dest_value = src_value * GST_SECOND / speexenc->rate;
+          *dest_value = src_value * GST_SECOND / enc->rate;
           break;
         default:
           res = FALSE;
@@ -351,7 +404,7 @@ gst_speexenc_convert_sink (GstPad * pad, GstFormat src_format,
           scale = bytes_per_sample;
           /* fallthrough */
         case GST_FORMAT_DEFAULT:
-          *dest_value = src_value * scale * speexenc->rate / GST_SECOND;
+          *dest_value = src_value * scale * enc->rate / GST_SECOND;
           break;
         default:
           res = FALSE;
@@ -363,28 +416,37 @@ gst_speexenc_convert_sink (GstPad * pad, GstFormat src_format,
   return res;
 }
 
+static gint64
+gst_speex_enc_get_latency (GstSpeexEnc * enc)
+{
+  /* See the Speex manual section "Latency and algorithmic delay" */
+  if (enc->rate == 8000)
+    return 30 * GST_MSECOND;
+  else
+    return 34 * GST_MSECOND;
+}
+
 static const GstQueryType *
-gst_speexenc_get_query_types (GstPad * pad)
+gst_speex_enc_get_query_types (GstPad * pad)
 {
-  static const GstQueryType gst_speexenc_src_query_types[] = {
+  static const GstQueryType gst_speex_enc_src_query_types[] = {
     GST_QUERY_POSITION,
     GST_QUERY_DURATION,
     GST_QUERY_CONVERT,
+    GST_QUERY_LATENCY,
     0
   };
 
-  return gst_speexenc_src_query_types;
+  return gst_speex_enc_src_query_types;
 }
 
 static gboolean
-gst_speexenc_src_query (GstPad * pad, GstQuery * query)
+gst_speex_enc_src_query (GstPad * pad, GstQuery * query)
 {
   gboolean res = TRUE;
-  GstSpeexEnc *speexenc;
-  GstPad *peerpad;
+  GstSpeexEnc *enc;
 
-  speexenc = GST_SPEEXENC (gst_pad_get_parent (pad));
-  peerpad = gst_pad_get_peer (GST_PAD (speexenc->sinkpad));
+  enc = GST_SPEEX_ENC (gst_pad_get_parent (pad));
 
   switch (GST_QUERY_TYPE (query)) {
     case GST_QUERY_POSITION:
@@ -393,16 +455,18 @@ gst_speexenc_src_query (GstPad * pad, GstQuery * query)
       gint64 pos, val;
 
       gst_query_parse_position (query, &req_fmt, NULL);
-      if ((res = gst_pad_query_position (peerpad, &req_fmt, &val))) {
+      if ((res = gst_pad_query_peer_position (enc->sinkpad, &req_fmt, &val))) {
         gst_query_set_position (query, req_fmt, val);
         break;
       }
 
       fmt = GST_FORMAT_TIME;
-      if (!(res = gst_pad_query_position (peerpad, &fmt, &pos)))
+      if (!(res = gst_pad_query_peer_position (enc->sinkpad, &fmt, &pos)))
         break;
 
-      if ((res = gst_pad_query_convert (peerpad, fmt, pos, &req_fmt, &val)))
+      if ((res =
+              gst_pad_query_peer_convert (enc->sinkpad, fmt, pos, &req_fmt,
+                  &val)))
         gst_query_set_position (query, req_fmt, val);
 
       break;
@@ -413,16 +477,18 @@ gst_speexenc_src_query (GstPad * pad, GstQuery * query)
       gint64 dur, val;
 
       gst_query_parse_duration (query, &req_fmt, NULL);
-      if ((res = gst_pad_query_duration (peerpad, &req_fmt, &val))) {
+      if ((res = gst_pad_query_peer_duration (enc->sinkpad, &req_fmt, &val))) {
         gst_query_set_duration (query, req_fmt, val);
         break;
       }
 
       fmt = GST_FORMAT_TIME;
-      if (!(res = gst_pad_query_duration (peerpad, &fmt, &dur)))
+      if (!(res = gst_pad_query_peer_duration (enc->sinkpad, &fmt, &dur)))
         break;
 
-      if ((res = gst_pad_query_convert (peerpad, fmt, dur, &req_fmt, &val))) {
+      if ((res =
+              gst_pad_query_peer_convert (enc->sinkpad, fmt, dur, &req_fmt,
+                  &val))) {
         gst_query_set_duration (query, req_fmt, val);
       }
       break;
@@ -433,30 +499,50 @@ gst_speexenc_src_query (GstPad * pad, GstQuery * query)
       gint64 src_val, dest_val;
 
       gst_query_parse_convert (query, &src_fmt, &src_val, &dest_fmt, &dest_val);
-      if (!(res = gst_speexenc_convert_src (pad, src_fmt, src_val, &dest_fmt,
+      if (!(res = gst_speex_enc_convert_src (pad, src_fmt, src_val, &dest_fmt,
                   &dest_val)))
         goto error;
       gst_query_set_convert (query, src_fmt, src_val, dest_fmt, dest_val);
       break;
     }
+    case GST_QUERY_LATENCY:
+    {
+      gboolean live;
+      GstClockTime min_latency, max_latency;
+      gint64 latency;
+
+      if ((res = gst_pad_peer_query (enc->sinkpad, query))) {
+        gst_query_parse_latency (query, &live, &min_latency, &max_latency);
+        GST_LOG_OBJECT (pad, "Upstream latency: %" GST_PTR_FORMAT, query);
+
+        latency = gst_speex_enc_get_latency (enc);
+
+        /* add our latency */
+        min_latency += latency;
+        if (max_latency != -1)
+          max_latency += latency;
+
+        gst_query_set_latency (query, live, min_latency, max_latency);
+        GST_LOG_OBJECT (pad, "Adjusted latency: %" GST_PTR_FORMAT, query);
+      }
+      break;
+    }
     default:
-      res = FALSE;
+      res = gst_pad_peer_query (enc->sinkpad, query);
       break;
   }
 
 error:
-  gst_object_unref (peerpad);
-  gst_object_unref (speexenc);
+
+  gst_object_unref (enc);
+
   return res;
 }
 
 static gboolean
-gst_speexenc_sink_query (GstPad * pad, GstQuery * query)
+gst_speex_enc_sink_query (GstPad * pad, GstQuery * query)
 {
   gboolean res = TRUE;
-  GstSpeexEnc *speexenc;
-
-  speexenc = GST_SPEEXENC (GST_PAD_PARENT (pad));
 
   switch (GST_QUERY_TYPE (query)) {
     case GST_QUERY_CONVERT:
@@ -466,14 +552,14 @@ gst_speexenc_sink_query (GstPad * pad, GstQuery * query)
 
       gst_query_parse_convert (query, &src_fmt, &src_val, &dest_fmt, &dest_val);
       if (!(res =
-              gst_speexenc_convert_sink (pad, src_fmt, src_val, &dest_fmt,
+              gst_speex_enc_convert_sink (pad, src_fmt, src_val, &dest_fmt,
                   &dest_val)))
         goto error;
       gst_query_set_convert (query, src_fmt, src_val, dest_fmt, dest_val);
       break;
     }
     default:
-      res = FALSE;
+      res = gst_pad_query_default (pad, query);
       break;
   }
 
@@ -482,399 +568,306 @@ error:
 }
 
 static void
-gst_speexenc_init (GstSpeexEnc * speexenc)
+gst_speex_enc_init (GstSpeexEnc * enc, GstSpeexEncClass * klass)
 {
-  speexenc->sinkpad =
-      gst_pad_new_from_template (gst_speexenc_sink_template, "sink");
-  gst_element_add_pad (GST_ELEMENT (speexenc), speexenc->sinkpad);
-  gst_pad_set_event_function (speexenc->sinkpad, gst_speexenc_sinkevent);
-  gst_pad_set_chain_function (speexenc->sinkpad, gst_speexenc_chain);
-  gst_pad_set_setcaps_function (speexenc->sinkpad, gst_speexenc_sink_setcaps);
-  gst_pad_set_query_function (speexenc->sinkpad,
-      GST_DEBUG_FUNCPTR (gst_speexenc_sink_query));
-
-  speexenc->srcpad =
-      gst_pad_new_from_template (gst_speexenc_src_template, "src");
-  gst_pad_set_query_function (speexenc->srcpad,
-      GST_DEBUG_FUNCPTR (gst_speexenc_src_query));
-  gst_pad_set_query_type_function (speexenc->srcpad,
-      GST_DEBUG_FUNCPTR (gst_speexenc_get_query_types));
-  gst_element_add_pad (GST_ELEMENT (speexenc), speexenc->srcpad);
-
-  speexenc->channels = -1;
-  speexenc->rate = -1;
-
-  speexenc->quality = DEFAULT_QUALITY;
-  speexenc->bitrate = DEFAULT_BITRATE;
-  speexenc->vbr = DEFAULT_VBR;
-  speexenc->abr = DEFAULT_ABR;
-  speexenc->vad = DEFAULT_VAD;
-  speexenc->dtx = DEFAULT_DTX;
-  speexenc->complexity = DEFAULT_COMPLEXITY;
-  speexenc->nframes = DEFAULT_NFRAMES;
-
-  speexenc->setup = FALSE;
-  speexenc->header_sent = FALSE;
-
-  speexenc->adapter = gst_adapter_new ();
+  enc->sinkpad = gst_pad_new_from_static_template (&sink_factory, "sink");
+  gst_element_add_pad (GST_ELEMENT (enc), enc->sinkpad);
+  gst_pad_set_event_function (enc->sinkpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_sinkevent));
+  gst_pad_set_chain_function (enc->sinkpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_chain));
+  gst_pad_set_setcaps_function (enc->sinkpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_sink_setcaps));
+  gst_pad_set_getcaps_function (enc->sinkpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_sink_getcaps));
+  gst_pad_set_query_function (enc->sinkpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_sink_query));
+
+  enc->srcpad = gst_pad_new_from_static_template (&src_factory, "src");
+  gst_pad_set_query_function (enc->srcpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_src_query));
+  gst_pad_set_query_type_function (enc->srcpad,
+      GST_DEBUG_FUNCPTR (gst_speex_enc_get_query_types));
+  gst_element_add_pad (GST_ELEMENT (enc), enc->srcpad);
+
+  enc->channels = -1;
+  enc->rate = -1;
+
+  enc->quality = DEFAULT_QUALITY;
+  enc->bitrate = DEFAULT_BITRATE;
+  enc->mode = DEFAULT_MODE;
+  enc->vbr = DEFAULT_VBR;
+  enc->abr = DEFAULT_ABR;
+  enc->vad = DEFAULT_VAD;
+  enc->dtx = DEFAULT_DTX;
+  enc->complexity = DEFAULT_COMPLEXITY;
+  enc->nframes = DEFAULT_NFRAMES;
+
+  enc->setup = FALSE;
+  enc->header_sent = FALSE;
+
+  enc->adapter = gst_adapter_new ();
 }
 
-
-/* FIXME: why are we not using the from/to vorbiscomment 
- * functions that are in -lgsttagedit-0.9 here? */
-
-static gchar *
-gst_speexenc_get_tag_value (const GstTagList * list, const gchar * tag,
-    int index)
+static GstBuffer *
+gst_speex_enc_create_metadata_buffer (GstSpeexEnc * enc)
 {
-  GType tag_type;
-  gchar *speexvalue = NULL;
-
-  if (tag == NULL)
-    return NULL;
-
-  tag_type = gst_tag_get_type (tag);
+  const GstTagList *user_tags;
+  GstTagList *merged_tags;
+  GstBuffer *comments = NULL;
 
-  /* get tag name right */
-  if ((strcmp (tag, GST_TAG_TRACK_NUMBER) == 0)
-      || (strcmp (tag, GST_TAG_ALBUM_VOLUME_NUMBER) == 0)
-      || (strcmp (tag, GST_TAG_TRACK_COUNT) == 0)
-      || (strcmp (tag, GST_TAG_ALBUM_VOLUME_COUNT) == 0)) {
-    guint track_no;
+  user_tags = gst_tag_setter_get_tag_list (GST_TAG_SETTER (enc));
 
-    if (gst_tag_list_get_uint_index (list, tag, index, &track_no)) {
-      speexvalue = g_strdup_printf ("%u", track_no);
-    } else {
-      GST_WARNING ("Failed to extract int tag %d for '%s'", index, tag);
-    }
-  } else if (tag_type == GST_TYPE_DATE) {
-    /* FIXME: how are dates represented in speex files? */
-    GDate *date;
-
-    if (gst_tag_list_get_date_index (list, tag, index, &date)) {
-      speexvalue =
-          g_strdup_printf ("%04d-%02d-%02d", (gint) g_date_get_year (date),
-          (gint) g_date_get_month (date), (gint) g_date_get_day (date));
-      g_date_free (date);
-    } else {
-      GST_WARNING ("Failed to extract date tag %d for '%s'", index, tag);
-    }
-  } else if (tag_type == G_TYPE_STRING) {
-    if (!gst_tag_list_get_string_index (list, tag, index, &speexvalue))
-      GST_WARNING ("Failed to extract string tag %d for '%s'", index, tag);
-  }
+  GST_DEBUG_OBJECT (enc, "upstream tags = %" GST_PTR_FORMAT, enc->tags);
+  GST_DEBUG_OBJECT (enc, "user-set tags = %" GST_PTR_FORMAT, user_tags);
 
-  return speexvalue;
-}
+  /* gst_tag_list_merge() will handle NULL for either or both lists fine */
+  merged_tags = gst_tag_list_merge (user_tags, enc->tags,
+      gst_tag_setter_get_tag_merge_mode (GST_TAG_SETTER (enc)));
 
-/*
- *  Comments will be stored in the Vorbis style.
- *  It is describled in the "Structure" section of
- *  http://www.xiph.org/ogg/vorbis/doc/v-comment.html
- *
- *  The comment header is decoded as follows:
- *  1) [vendor_length] = read an unsigned integer of 32 bits
- *  2) [vendor_string] = read a UTF-8 vector as [vendor_length] octets
- *  3) [user_comment_list_length] = read an unsigned integer of 32 bits
- *  4) iterate [user_comment_list_length] times {
- *     5) [length] = read an unsigned integer of 32 bits
- *     6) this iteration's user comment = read a UTF-8 vector as [length] octets
- *     }
- *  7) [framing_bit] = read a single bit as boolean
- *  8) if ( [framing_bit]  unset or end of packet ) then ERROR
- *  9) done.
- *
- *  If you have troubles, please write to ymnk@jcraft.com.
- */
-static void
-comment_init (guint8 ** comments, int *length, char *vendor_string)
-{
-  int vendor_length = strlen (vendor_string);
-  int user_comment_list_length = 0;
-  int len = 4 + vendor_length + 4;
-  guint8 *p = g_malloc (len);
-
-  GST_WRITE_UINT32_LE (p, vendor_length);
-  memcpy (p + 4, vendor_string, vendor_length);
-  GST_WRITE_UINT32_LE (p + 4 + vendor_length, user_comment_list_length);
-  *length = len;
-  *comments = p;
-}
-static void
-comment_add (guint8 ** comments, int *length, const char *tag, char *val)
-{
-  guint8 *p = *comments;
-  int vendor_length = GST_READ_UINT32_LE (p);
-  int user_comment_list_length = GST_READ_UINT32_LE (p + 4 + vendor_length);
-  int tag_len = (tag ? strlen (tag) : 0);
-  int val_len = strlen (val);
-  int len = (*length) + 4 + tag_len + val_len;
-
-  p = g_realloc (p, len);
-
-  GST_WRITE_UINT32_LE (p + *length, tag_len + val_len); /* length of comment */
-  if (tag)
-    memcpy (p + *length + 4, (guint8 *) tag, tag_len);  /* comment */
-  memcpy (p + *length + 4 + tag_len, val, val_len);     /* comment */
-  GST_WRITE_UINT32_LE (p + 4 + vendor_length, user_comment_list_length + 1);
-
-  *comments = p;
-  *length = len;
-}
+  if (merged_tags == NULL)
+    merged_tags = gst_tag_list_new ();
 
-static void
-gst_speexenc_metadata_set1 (const GstTagList * list, const gchar * tag,
-    gpointer speexenc)
-{
-  const gchar *speextag = NULL;
-  gchar *speexvalue = NULL;
-  guint i, count;
-  GstSpeexEnc *enc = GST_SPEEXENC (speexenc);
-
-  speextag = gst_tag_to_vorbis_tag (tag);
-  if (speextag == NULL) {
-    return;
-  }
+  GST_DEBUG_OBJECT (enc, "merged   tags = %" GST_PTR_FORMAT, merged_tags);
+  comments = gst_tag_list_to_vorbiscomment_buffer (merged_tags, NULL,
+      0, "Encoded with GStreamer Speexenc");
+  gst_tag_list_free (merged_tags);
 
-  count = gst_tag_list_get_tag_size (list, tag);
-  for (i = 0; i < count; i++) {
-    speexvalue = gst_speexenc_get_tag_value (list, tag, i);
+  GST_BUFFER_OFFSET (comments) = enc->bytes_out;
+  GST_BUFFER_OFFSET_END (comments) = 0;
 
-    if (speexvalue != NULL) {
-      comment_add (&enc->comments, &enc->comment_len, speextag, speexvalue);
-    }
-  }
+  return comments;
 }
 
 static void
-gst_speexenc_set_metadata (GstSpeexEnc * speexenc)
+gst_speex_enc_set_last_msg (GstSpeexEnc * enc, const gchar * msg)
 {
-  GstTagList *copy;
-  const GstTagList *user_tags;
-
-  user_tags = gst_tag_setter_get_tag_list (GST_TAG_SETTER (speexenc));
-  if (!(speexenc->tags || user_tags))
-    return;
-
-  comment_init (&speexenc->comments, &speexenc->comment_len,
-      "Encoded with GStreamer Speexenc");
-  copy =
-      gst_tag_list_merge (user_tags, speexenc->tags,
-      gst_tag_setter_get_tag_merge_mode (GST_TAG_SETTER (speexenc)));
-  gst_tag_list_foreach (copy, gst_speexenc_metadata_set1, speexenc);
-  gst_tag_list_free (copy);
+  g_free (enc->last_message);
+  enc->last_message = g_strdup (msg);
+  GST_WARNING_OBJECT (enc, "%s", msg);
+  g_object_notify (G_OBJECT (enc), "last-message");
 }
 
 static gboolean
-gst_speexenc_setup (GstSpeexEnc * speexenc)
+gst_speex_enc_setup (GstSpeexEnc * enc)
 {
-  speexenc->setup = FALSE;
+  enc->setup = FALSE;
 
-  switch (speexenc->mode) {
-    case GST_SPEEXENC_MODE_UWB:
-      speexenc->speex_mode = (SpeexMode *) & speex_uwb_mode;
+  switch (enc->mode) {
+    case GST_SPEEX_ENC_MODE_UWB:
+      GST_LOG_OBJECT (enc, "configuring for requested UWB mode");
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_UWB);
       break;
-    case GST_SPEEXENC_MODE_WB:
-      speexenc->speex_mode = (SpeexMode *) & speex_wb_mode;
+    case GST_SPEEX_ENC_MODE_WB:
+      GST_LOG_OBJECT (enc, "configuring for requested WB mode");
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_WB);
       break;
-    case GST_SPEEXENC_MODE_NB:
-      speexenc->speex_mode = (SpeexMode *) & speex_nb_mode;
+    case GST_SPEEX_ENC_MODE_NB:
+      GST_LOG_OBJECT (enc, "configuring for requested NB mode");
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_NB);
       break;
-    case GST_SPEEXENC_MODE_AUTO:
+    case GST_SPEEX_ENC_MODE_AUTO:
       /* fall through */
+      GST_LOG_OBJECT (enc, "finding best mode");
     default:
       break;
   }
 
-  if (speexenc->rate > 25000) {
-    if (speexenc->mode == GST_SPEEXENC_MODE_AUTO) {
-      speexenc->speex_mode = (SpeexMode *) & speex_uwb_mode;
+  if (enc->rate > 25000) {
+    if (enc->mode == GST_SPEEX_ENC_MODE_AUTO) {
+      GST_LOG_OBJECT (enc, "selected UWB mode for samplerate %d", enc->rate);
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_UWB);
     } else {
-      if (speexenc->speex_mode != &speex_uwb_mode) {
-        speexenc->last_message =
-            g_strdup_printf
-            ("Warning: suggest to use ultra wide band mode for this rate");
-        g_object_notify (G_OBJECT (speexenc), "last_message");
+      if (enc->speex_mode != speex_lib_get_mode (SPEEX_MODEID_UWB)) {
+        gst_speex_enc_set_last_msg (enc,
+            "Warning: suggest to use ultra wide band mode for this rate");
       }
     }
-  } else if (speexenc->rate > 12500) {
-    if (speexenc->mode == GST_SPEEXENC_MODE_AUTO) {
-      speexenc->speex_mode = (SpeexMode *) & speex_wb_mode;
+  } else if (enc->rate > 12500) {
+    if (enc->mode == GST_SPEEX_ENC_MODE_AUTO) {
+      GST_LOG_OBJECT (enc, "selected WB mode for samplerate %d", enc->rate);
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_WB);
     } else {
-      if (speexenc->speex_mode != &speex_wb_mode) {
-        speexenc->last_message =
-            g_strdup_printf
-            ("Warning: suggest to use wide band mode for this rate");
-        g_object_notify (G_OBJECT (speexenc), "last_message");
+      if (enc->speex_mode != speex_lib_get_mode (SPEEX_MODEID_WB)) {
+        gst_speex_enc_set_last_msg (enc,
+            "Warning: suggest to use wide band mode for this rate");
       }
     }
   } else {
-    if (speexenc->mode == GST_SPEEXENC_MODE_AUTO) {
-      speexenc->speex_mode = (SpeexMode *) & speex_nb_mode;
+    if (enc->mode == GST_SPEEX_ENC_MODE_AUTO) {
+      GST_LOG_OBJECT (enc, "selected NB mode for samplerate %d", enc->rate);
+      enc->speex_mode = speex_lib_get_mode (SPEEX_MODEID_NB);
     } else {
-      if (speexenc->speex_mode != &speex_nb_mode) {
-        speexenc->last_message =
-            g_strdup_printf
-            ("Warning: suggest to use narrow band mode for this rate");
-        g_object_notify (G_OBJECT (speexenc), "last_message");
+      if (enc->speex_mode != speex_lib_get_mode (SPEEX_MODEID_NB)) {
+        gst_speex_enc_set_last_msg (enc,
+            "Warning: suggest to use narrow band mode for this rate");
       }
     }
   }
 
-  if (speexenc->rate != 8000 && speexenc->rate != 16000
-      && speexenc->rate != 32000) {
-    speexenc->last_message =
-        g_strdup_printf ("Warning: speex is optimized for 8, 16 and 32 KHz");
-    g_object_notify (G_OBJECT (speexenc), "last_message");
+  if (enc->rate != 8000 && enc->rate != 16000 && enc->rate != 32000) {
+    gst_speex_enc_set_last_msg (enc,
+        "Warning: speex is optimized for 8, 16 and 32 KHz");
   }
 
-  speex_init_header (&speexenc->header, speexenc->rate, 1,
-      speexenc->speex_mode);
-  speexenc->header.frames_per_packet = speexenc->nframes;
-  speexenc->header.vbr = speexenc->vbr;
-  speexenc->header.nb_channels = speexenc->channels;
+  speex_init_header (&enc->header, enc->rate, 1, enc->speex_mode);
+  enc->header.frames_per_packet = enc->nframes;
+  enc->header.vbr = enc->vbr;
+  enc->header.nb_channels = enc->channels;
 
   /*Initialize Speex encoder */
-  speexenc->state = speex_encoder_init (speexenc->speex_mode);
+  enc->state = speex_encoder_init (enc->speex_mode);
 
-  speex_encoder_ctl (speexenc->state, SPEEX_GET_FRAME_SIZE,
-      &speexenc->frame_size);
-  speex_encoder_ctl (speexenc->state, SPEEX_SET_COMPLEXITY,
-      &speexenc->complexity);
-  speex_encoder_ctl (speexenc->state, SPEEX_SET_SAMPLING_RATE, &speexenc->rate);
+  speex_encoder_ctl (enc->state, SPEEX_GET_FRAME_SIZE, &enc->frame_size);
+  speex_encoder_ctl (enc->state, SPEEX_SET_COMPLEXITY, &enc->complexity);
+  speex_encoder_ctl (enc->state, SPEEX_SET_SAMPLING_RATE, &enc->rate);
 
-  if (speexenc->vbr)
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_VBR_QUALITY,
-        &speexenc->quality);
+  if (enc->vbr)
+    speex_encoder_ctl (enc->state, SPEEX_SET_VBR_QUALITY, &enc->quality);
   else {
-    gint tmp = floor (speexenc->quality);
+    gint tmp = floor (enc->quality);
 
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_QUALITY, &tmp);
+    speex_encoder_ctl (enc->state, SPEEX_SET_QUALITY, &tmp);
   }
-  if (speexenc->bitrate) {
-    if (speexenc->quality >= 0.0 && speexenc->vbr) {
-      speexenc->last_message =
-          g_strdup_printf ("Warning: bitrate option is overriding quality");
-      g_object_notify (G_OBJECT (speexenc), "last_message");
+  if (enc->bitrate) {
+    if (enc->quality >= 0.0 && enc->vbr) {
+      gst_speex_enc_set_last_msg (enc,
+          "Warning: bitrate option is overriding quality");
     }
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_BITRATE, &speexenc->bitrate);
+    speex_encoder_ctl (enc->state, SPEEX_SET_BITRATE, &enc->bitrate);
   }
-  if (speexenc->vbr) {
+  if (enc->vbr) {
     gint tmp = 1;
 
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_VBR, &tmp);
-  } else if (speexenc->vad) {
+    speex_encoder_ctl (enc->state, SPEEX_SET_VBR, &tmp);
+  } else if (enc->vad) {
     gint tmp = 1;
 
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_VAD, &tmp);
+    speex_encoder_ctl (enc->state, SPEEX_SET_VAD, &tmp);
   }
 
-  if (speexenc->dtx) {
+  if (enc->dtx) {
     gint tmp = 1;
 
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_DTX, &tmp);
+    speex_encoder_ctl (enc->state, SPEEX_SET_DTX, &tmp);
   }
 
-  if (speexenc->dtx && !(speexenc->vbr || speexenc->abr || speexenc->vad)) {
-    speexenc->last_message =
-        g_strdup_printf ("Warning: dtx is useless without vad, vbr or abr");
-    g_object_notify (G_OBJECT (speexenc), "last_message");
-  } else if ((speexenc->vbr || speexenc->abr) && (speexenc->vad)) {
-    speexenc->last_message =
-        g_strdup_printf ("Warning: vad is already implied by vbr or abr");
-    g_object_notify (G_OBJECT (speexenc), "last_message");
+  if (enc->dtx && !(enc->vbr || enc->abr || enc->vad)) {
+    gst_speex_enc_set_last_msg (enc,
+        "Warning: dtx is useless without vad, vbr or abr");
+  } else if ((enc->vbr || enc->abr) && (enc->vad)) {
+    gst_speex_enc_set_last_msg (enc,
+        "Warning: vad is already implied by vbr or abr");
   }
 
-  if (speexenc->abr) {
-    speex_encoder_ctl (speexenc->state, SPEEX_SET_ABR, &speexenc->abr);
+  if (enc->abr) {
+    speex_encoder_ctl (enc->state, SPEEX_SET_ABR, &enc->abr);
   }
 
-  speex_encoder_ctl (speexenc->state, SPEEX_GET_LOOKAHEAD,
-      &speexenc->lookahead);
+  speex_encoder_ctl (enc->state, SPEEX_GET_LOOKAHEAD, &enc->lookahead);
+
+  GST_LOG_OBJECT (enc, "we have frame size %d, lookahead %d", enc->frame_size,
+      enc->lookahead);
 
-  speexenc->setup = TRUE;
+  enc->setup = TRUE;
 
   return TRUE;
 }
 
 /* prepare a buffer for transmission */
 static GstBuffer *
-gst_speexenc_buffer_from_data (GstSpeexEnc * speexenc, guchar * data,
+gst_speex_enc_buffer_from_data (GstSpeexEnc * enc, guchar * data,
     gint data_len, guint64 granulepos)
 {
   GstBuffer *outbuf;
 
   outbuf = gst_buffer_new_and_alloc (data_len);
   memcpy (GST_BUFFER_DATA (outbuf), data, data_len);
-  GST_BUFFER_OFFSET (outbuf) = speexenc->bytes_out;
+  GST_BUFFER_OFFSET (outbuf) = enc->bytes_out;
   GST_BUFFER_OFFSET_END (outbuf) = granulepos;
 
-  GST_DEBUG ("encoded buffer of %d bytes", GST_BUFFER_SIZE (outbuf));
+  GST_LOG_OBJECT (enc, "encoded buffer of %d bytes", GST_BUFFER_SIZE (outbuf));
   return outbuf;
 }
 
 
 /* push out the buffer and do internal bookkeeping */
 static GstFlowReturn
-gst_speexenc_push_buffer (GstSpeexEnc * speexenc, GstBuffer * buffer)
+gst_speex_enc_push_buffer (GstSpeexEnc * enc, GstBuffer * buffer)
 {
-  speexenc->bytes_out += GST_BUFFER_SIZE (buffer);
+  guint size;
+
+  size = GST_BUFFER_SIZE (buffer);
+
+  enc->bytes_out += size;
 
-  return gst_pad_push (speexenc->srcpad, buffer);
+  GST_DEBUG_OBJECT (enc, "pushing output buffer of size %u", size);
 
+  return gst_pad_push (enc->srcpad, buffer);
 }
 
 static GstCaps *
-gst_speexenc_set_header_on_caps (GstCaps * caps, GstBuffer * buf1,
+gst_speex_enc_set_header_on_caps (GstCaps * caps, GstBuffer * buf1,
     GstBuffer * buf2)
 {
-  caps = gst_caps_make_writable (caps);
-  GstStructure *structure = gst_caps_get_structure (caps, 0);
-  GValue list = { 0 };
+  GstStructure *structure = NULL;
+  GstBuffer *buf;
+  GValue array = { 0 };
   GValue value = { 0 };
 
+  caps = gst_caps_make_writable (caps);
+  structure = gst_caps_get_structure (caps, 0);
+
+  g_assert (gst_buffer_is_metadata_writable (buf1));
+  g_assert (gst_buffer_is_metadata_writable (buf2));
+
   /* mark buffers */
   GST_BUFFER_FLAG_SET (buf1, GST_BUFFER_FLAG_IN_CAPS);
   GST_BUFFER_FLAG_SET (buf2, GST_BUFFER_FLAG_IN_CAPS);
 
   /* put buffers in a fixed list */
-  g_value_init (&list, GST_TYPE_ARRAY);
+  g_value_init (&array, GST_TYPE_ARRAY);
   g_value_init (&value, GST_TYPE_BUFFER);
-  gst_value_set_buffer (&value, buf1);
-  gst_value_list_append_value (&list, &value);
+  buf = gst_buffer_copy (buf1);
+  gst_value_set_buffer (&value, buf);
+  gst_buffer_unref (buf);
+  gst_value_array_append_value (&array, &value);
   g_value_unset (&value);
   g_value_init (&value, GST_TYPE_BUFFER);
-  gst_value_set_buffer (&value, buf2);
-  gst_value_list_append_value (&list, &value);
-  gst_structure_set_value (structure, "streamheader", &list);
+  buf = gst_buffer_copy (buf2);
+  gst_value_set_buffer (&value, buf);
+  gst_buffer_unref (buf);
+  gst_value_array_append_value (&array, &value);
+  gst_structure_set_value (structure, "streamheader", &array);
   g_value_unset (&value);
-  g_value_unset (&list);
+  g_value_unset (&array);
 
   return caps;
 }
 
 
 static gboolean
-gst_speexenc_sinkevent (GstPad * pad, GstEvent * event)
+gst_speex_enc_sinkevent (GstPad * pad, GstEvent * event)
 {
   gboolean res = TRUE;
-  GstSpeexEnc *speexenc;
+  GstSpeexEnc *enc;
 
-  speexenc = GST_SPEEXENC (GST_PAD_PARENT (pad));
+  enc = GST_SPEEX_ENC (gst_pad_get_parent (pad));
 
   switch (GST_EVENT_TYPE (event)) {
     case GST_EVENT_EOS:
-      speexenc->eos = TRUE;
+      if (enc->setup)
+        gst_speex_enc_encode (enc, TRUE);
       res = gst_pad_event_default (pad, event);
       break;
     case GST_EVENT_TAG:
     {
-      GstTagList *list;
+      if (enc->tags) {
+        GstTagList *list;
 
-      gst_event_parse_tag (event, &list);
-      if (speexenc->tags) {
-        gst_tag_list_insert (speexenc->tags, list,
-            gst_tag_setter_get_tag_merge_mode (GST_TAG_SETTER (speexenc)));
+        gst_event_parse_tag (event, &list);
+        gst_tag_list_insert (enc->tags, list,
+            gst_tag_setter_get_tag_merge_mode (GST_TAG_SETTER (enc)));
       } else {
         g_assert_not_reached ();
       }
@@ -885,27 +878,104 @@ gst_speexenc_sinkevent (GstPad * pad, GstEvent * event)
       res = gst_pad_event_default (pad, event);
       break;
   }
+
+  gst_object_unref (enc);
+
   return res;
 }
 
-
 static GstFlowReturn
-gst_speexenc_chain (GstPad * pad, GstBuffer * buf)
+gst_speex_enc_encode (GstSpeexEnc * enc, gboolean flush)
 {
-  GstSpeexEnc *speexenc;
+  gint frame_size = enc->frame_size;
+  gint bytes = frame_size * 2 * enc->channels;
   GstFlowReturn ret = GST_FLOW_OK;
 
-  speexenc = GST_SPEEXENC (gst_pad_get_parent (pad));
+  if (flush && gst_adapter_available (enc->adapter) % bytes != 0) {
+    guint diff = gst_adapter_available (enc->adapter) % bytes;
+    GstBuffer *buf = gst_buffer_new_and_alloc (diff);
 
-  if (!speexenc->setup) {
-    gst_buffer_unref (buf);
-    GST_ELEMENT_ERROR (speexenc, CORE, NEGOTIATION, (NULL),
-        ("encoder not initialized (input is not audio?)"));
-    ret = GST_FLOW_UNEXPECTED;
-    goto error;
+    memset (GST_BUFFER_DATA (buf), 0, diff);
+    gst_adapter_push (enc->adapter, buf);
   }
 
-  if (!speexenc->header_sent) {
+  while (gst_adapter_available (enc->adapter) >= bytes) {
+    gint16 *data;
+    gint outsize, written, dtx_ret;
+    GstBuffer *outbuf;
+
+    data = (gint16 *) gst_adapter_take (enc->adapter, bytes);
+
+    enc->samples_in += frame_size;
+
+    GST_DEBUG_OBJECT (enc, "encoding %d samples (%d bytes)", frame_size, bytes);
+
+    if (enc->channels == 2) {
+      speex_encode_stereo_int (data, frame_size, &enc->bits);
+    }
+    dtx_ret = speex_encode_int (enc->state, data, &enc->bits);
+
+    g_free (data);
+
+    enc->frameno++;
+    enc->frameno_out++;
+
+    if ((enc->frameno % enc->nframes) != 0)
+      continue;
+
+    speex_bits_insert_terminator (&enc->bits);
+    outsize = speex_bits_nbytes (&enc->bits);
+
+    ret = gst_pad_alloc_buffer_and_set_caps (enc->srcpad,
+        GST_BUFFER_OFFSET_NONE, outsize, GST_PAD_CAPS (enc->srcpad), &outbuf);
+
+    if ((GST_FLOW_OK != ret))
+      goto done;
+
+    written = speex_bits_write (&enc->bits,
+        (gchar *) GST_BUFFER_DATA (outbuf), outsize);
+    g_assert (written == outsize);
+    speex_bits_reset (&enc->bits);
+
+    if (!dtx_ret)
+      GST_BUFFER_FLAG_SET (outbuf, GST_BUFFER_FLAG_GAP);
+
+    GST_BUFFER_TIMESTAMP (outbuf) = enc->start_ts +
+        gst_util_uint64_scale_int ((enc->frameno_out -
+            enc->nframes) * frame_size - enc->lookahead, GST_SECOND, enc->rate);
+    GST_BUFFER_DURATION (outbuf) =
+        gst_util_uint64_scale_int (frame_size * enc->nframes, GST_SECOND,
+        enc->rate);
+    /* set gp time and granulepos; see gst-plugins-base/ext/ogg/README */
+    GST_BUFFER_OFFSET_END (outbuf) = enc->granulepos_offset +
+        ((enc->frameno_out) * frame_size - enc->lookahead);
+    GST_BUFFER_OFFSET (outbuf) =
+        gst_util_uint64_scale_int (GST_BUFFER_OFFSET_END (outbuf), GST_SECOND,
+        enc->rate);
+
+    ret = gst_speex_enc_push_buffer (enc, outbuf);
+
+    if ((GST_FLOW_OK != ret) && (GST_FLOW_NOT_LINKED != ret))
+      goto done;
+  }
+
+done:
+
+  return ret;
+}
+
+static GstFlowReturn
+gst_speex_enc_chain (GstPad * pad, GstBuffer * buf)
+{
+  GstSpeexEnc *enc;
+  GstFlowReturn ret = GST_FLOW_OK;
+
+  enc = GST_SPEEX_ENC (GST_PAD_PARENT (pad));
+
+  if (!enc->setup)
+    goto not_setup;
+
+  if (!enc->header_sent) {
     /* Speex streams begin with two headers; the initial header (with
        most of the codec setup parameters) which is mandated by the Ogg
        bitstream spec.  The second header holds any comment fields.
@@ -917,159 +987,179 @@ gst_speexenc_chain (GstPad * pad, GstBuffer * buf)
     guchar *data;
     gint data_len;
 
-    gst_speexenc_set_metadata (speexenc);
-
     /* create header buffer */
-    data = (guint8 *) speex_header_to_packet (&speexenc->header, &data_len);
-    buf1 = gst_speexenc_buffer_from_data (speexenc, data, data_len, 0);
+    data = (guint8 *) speex_header_to_packet (&enc->header, &data_len);
+    buf1 = gst_speex_enc_buffer_from_data (enc, data, data_len, 0);
+    free (data);
 
     /* create comment buffer */
-    buf2 =
-        gst_speexenc_buffer_from_data (speexenc, speexenc->comments,
-        speexenc->comment_len, 0);
+    buf2 = gst_speex_enc_create_metadata_buffer (enc);
 
     /* mark and put on caps */
-    caps = gst_pad_get_caps (speexenc->srcpad);
-    caps = gst_speexenc_set_header_on_caps (caps, buf1, buf2);
+    caps = gst_pad_get_caps (enc->srcpad);
+    caps = gst_speex_enc_set_header_on_caps (caps, buf1, buf2);
+
+    gst_caps_set_simple (caps,
+        "rate", G_TYPE_INT, enc->rate,
+        "channels", G_TYPE_INT, enc->channels, NULL);
 
     /* negotiate with these caps */
-    GST_DEBUG ("here are the caps: %" GST_PTR_FORMAT, caps);
-    gst_pad_set_caps (speexenc->srcpad, caps);
+    GST_DEBUG_OBJECT (enc, "here are the caps: %" GST_PTR_FORMAT, caps);
+    gst_pad_set_caps (enc->srcpad, caps);
 
     gst_buffer_set_caps (buf1, caps);
     gst_buffer_set_caps (buf2, caps);
+    gst_caps_unref (caps);
 
     /* push out buffers */
-    ret = gst_speexenc_push_buffer (speexenc, buf1);
+    ret = gst_speex_enc_push_buffer (enc, buf1);
 
-    if ((GST_FLOW_OK != ret) && (GST_FLOW_NOT_LINKED != ret)) {
-      gst_buffer_unref (buf1);
-      goto error;
+    if (ret != GST_FLOW_OK) {
+      gst_buffer_unref (buf2);
+      goto done;
     }
 
-    ret = gst_speexenc_push_buffer (speexenc, buf2);
+    ret = gst_speex_enc_push_buffer (enc, buf2);
 
-    if ((GST_FLOW_OK != ret) && (GST_FLOW_NOT_LINKED != ret)) {
+    if (ret != GST_FLOW_OK)
+      goto done;
 
-      gst_buffer_unref (buf2);
-      goto error;
-    }
-
-    speex_bits_init (&speexenc->bits);
-    speex_bits_reset (&speexenc->bits);
+    speex_bits_reset (&enc->bits);
 
-    speexenc->header_sent = TRUE;
+    enc->header_sent = TRUE;
   }
 
-  {
-    gint frame_size = speexenc->frame_size;
-    gint bytes = frame_size * 2 * speexenc->channels;
+  /* Save the timestamp of the first buffer. This will be later
+   * used as offset for all following buffers */
+  if (enc->start_ts == GST_CLOCK_TIME_NONE) {
+    if (GST_BUFFER_TIMESTAMP_IS_VALID (buf)) {
+      enc->start_ts = GST_BUFFER_TIMESTAMP (buf);
+      enc->granulepos_offset = gst_util_uint64_scale
+          (GST_BUFFER_TIMESTAMP (buf), enc->rate, GST_SECOND);
+    } else {
+      enc->start_ts = 0;
+      enc->granulepos_offset = 0;
+    }
+  }
 
-    /* push buffer to adapter */
-    gst_adapter_push (speexenc->adapter, buf);
+  /* Check if we have a continous stream, if not drop some samples or the buffer or
+   * insert some silence samples */
+  if (enc->next_ts != GST_CLOCK_TIME_NONE &&
+      GST_BUFFER_TIMESTAMP (buf) < enc->next_ts) {
+    guint64 diff = enc->next_ts - GST_BUFFER_TIMESTAMP (buf);
+    guint64 diff_bytes;
+
+    GST_WARNING_OBJECT (enc, "Buffer is older than previous "
+        "timestamp + duration (%" GST_TIME_FORMAT "< %" GST_TIME_FORMAT
+        "), cannot handle. Clipping buffer.",
+        GST_TIME_ARGS (GST_BUFFER_TIMESTAMP (buf)),
+        GST_TIME_ARGS (enc->next_ts));
+
+    diff_bytes = GST_CLOCK_TIME_TO_FRAMES (diff, enc->rate) * enc->channels * 2;
+    if (diff_bytes >= GST_BUFFER_SIZE (buf)) {
+      gst_buffer_unref (buf);
+      return GST_FLOW_OK;
+    }
+    buf = gst_buffer_make_metadata_writable (buf);
+    GST_BUFFER_DATA (buf) += diff_bytes;
+    GST_BUFFER_SIZE (buf) -= diff_bytes;
 
-    while (gst_adapter_available (speexenc->adapter) >= bytes) {
-      gint16 *data;
-      gint i;
-      gint outsize, written;
-      GstBuffer *outbuf;
+    GST_BUFFER_TIMESTAMP (buf) += diff;
+    if (GST_BUFFER_DURATION_IS_VALID (buf))
+      GST_BUFFER_DURATION (buf) -= diff;
+  }
 
-      data = (gint16 *) gst_adapter_peek (speexenc->adapter, bytes);
+  if (enc->next_ts != GST_CLOCK_TIME_NONE
+      && GST_BUFFER_TIMESTAMP_IS_VALID (buf)) {
+    guint64 max_diff =
+        gst_util_uint64_scale (enc->frame_size, GST_SECOND, enc->rate);
 
-      for (i = 0; i < frame_size * speexenc->channels; i++) {
-        speexenc->input[i] = (gfloat) data[i];
-      }
-      gst_adapter_flush (speexenc->adapter, bytes);
+    if (GST_BUFFER_TIMESTAMP (buf) != enc->next_ts &&
+        GST_BUFFER_TIMESTAMP (buf) - enc->next_ts > max_diff) {
+      GST_WARNING_OBJECT (enc,
+          "Discontinuity detected: %" G_GUINT64_FORMAT " > %" G_GUINT64_FORMAT,
+          GST_BUFFER_TIMESTAMP (buf) - enc->next_ts, max_diff);
 
-      speexenc->samples_in += frame_size;
+      gst_speex_enc_encode (enc, TRUE);
 
-      if (speexenc->channels == 2) {
-        speex_encode_stereo (speexenc->input, frame_size, &speexenc->bits);
-      }
-      speex_encode (speexenc->state, speexenc->input, &speexenc->bits);
-
-      speexenc->frameno++;
+      enc->frameno_out = 0;
+      enc->start_ts = GST_BUFFER_TIMESTAMP (buf);
+      enc->granulepos_offset = gst_util_uint64_scale
+          (GST_BUFFER_TIMESTAMP (buf), enc->rate, GST_SECOND);
+    }
+  }
 
-      if ((speexenc->frameno % speexenc->nframes) != 0)
-        continue;
+  if (GST_BUFFER_TIMESTAMP_IS_VALID (buf)
+      && GST_BUFFER_DURATION_IS_VALID (buf))
+    enc->next_ts = GST_BUFFER_TIMESTAMP (buf) + GST_BUFFER_DURATION (buf);
+  else
+    enc->next_ts = GST_CLOCK_TIME_NONE;
 
-      speex_bits_insert_terminator (&speexenc->bits);
-      outsize = speex_bits_nbytes (&speexenc->bits);
+  GST_DEBUG_OBJECT (enc, "received buffer of %u bytes", GST_BUFFER_SIZE (buf));
 
-      ret = gst_pad_alloc_buffer_and_set_caps (speexenc->srcpad,
-          GST_BUFFER_OFFSET_NONE, outsize, GST_PAD_CAPS (speexenc->srcpad),
-          &outbuf);
+  /* push buffer to adapter */
+  gst_adapter_push (enc->adapter, buf);
+  buf = NULL;
 
-      if ((GST_FLOW_OK != ret)) {
-        goto error;
-      }
+  ret = gst_speex_enc_encode (enc, FALSE);
 
-      written = speex_bits_write (&speexenc->bits,
-          (gchar *) GST_BUFFER_DATA (outbuf), outsize);
-      g_assert (written == outsize);
-      speex_bits_reset (&speexenc->bits);
+done:
 
-      GST_BUFFER_TIMESTAMP (outbuf) =
-          (speexenc->frameno * frame_size -
-          speexenc->lookahead) * GST_SECOND / speexenc->rate;
-      GST_BUFFER_DURATION (outbuf) = frame_size * GST_SECOND / speexenc->rate;
-      GST_BUFFER_OFFSET (outbuf) = speexenc->bytes_out;
-      GST_BUFFER_OFFSET_END (outbuf) =
-          speexenc->frameno * frame_size - speexenc->lookahead;
+  if (buf)
+    gst_buffer_unref (buf);
 
-      ret = gst_speexenc_push_buffer (speexenc, outbuf);
+  return ret;
 
-      if ((GST_FLOW_OK != ret) && (GST_FLOW_NOT_LINKED != ret)) {
-        gst_buffer_unref (outbuf);
-        goto error;
-      }
-    }
+  /* ERRORS */
+not_setup:
+  {
+    GST_ELEMENT_ERROR (enc, CORE, NEGOTIATION, (NULL),
+        ("encoder not initialized (input is not audio?)"));
+    ret = GST_FLOW_NOT_NEGOTIATED;
+    goto done;
   }
 
-error:
-
-  gst_object_unref (speexenc);
-  return ret;
 }
 
 
 static void
-gst_speexenc_get_property (GObject * object, guint prop_id, GValue * value,
+gst_speex_enc_get_property (GObject * object, guint prop_id, GValue * value,
     GParamSpec * pspec)
 {
-  GstSpeexEnc *speexenc;
+  GstSpeexEnc *enc;
 
-  g_return_if_fail (GST_IS_SPEEXENC (object));
-
-  speexenc = GST_SPEEXENC (object);
+  enc = GST_SPEEX_ENC (object);
 
   switch (prop_id) {
-    case ARG_QUALITY:
-      g_value_set_float (value, speexenc->quality);
+    case PROP_QUALITY:
+      g_value_set_float (value, enc->quality);
+      break;
+    case PROP_BITRATE:
+      g_value_set_int (value, enc->bitrate);
       break;
-    case ARG_BITRATE:
-      g_value_set_int (value, speexenc->bitrate);
+    case PROP_MODE:
+      g_value_set_enum (value, enc->mode);
       break;
-    case ARG_VBR:
-      g_value_set_boolean (value, speexenc->vbr);
+    case PROP_VBR:
+      g_value_set_boolean (value, enc->vbr);
       break;
-    case ARG_ABR:
-      g_value_set_int (value, speexenc->abr);
+    case PROP_ABR:
+      g_value_set_int (value, enc->abr);
       break;
-    case ARG_VAD:
-      g_value_set_boolean (value, speexenc->vad);
+    case PROP_VAD:
+      g_value_set_boolean (value, enc->vad);
       break;
-    case ARG_DTX:
-      g_value_set_boolean (value, speexenc->dtx);
+    case PROP_DTX:
+      g_value_set_boolean (value, enc->dtx);
       break;
-    case ARG_COMPLEXITY:
-      g_value_set_int (value, speexenc->complexity);
+    case PROP_COMPLEXITY:
+      g_value_set_int (value, enc->complexity);
       break;
-    case ARG_NFRAMES:
-      g_value_set_int (value, speexenc->nframes);
+    case PROP_NFRAMES:
+      g_value_set_int (value, enc->nframes);
       break;
-    case ARG_LAST_MESSAGE:
-      g_value_set_string (value, speexenc->last_message);
+    case PROP_LAST_MESSAGE:
+      g_value_set_string (value, enc->last_message);
       break;
     default:
       G_OBJECT_WARN_INVALID_PROPERTY_ID (object, prop_id, pspec);
@@ -1078,39 +1168,40 @@ gst_speexenc_get_property (GObject * object, guint prop_id, GValue * value,
 }
 
 static void
-gst_speexenc_set_property (GObject * object, guint prop_id,
+gst_speex_enc_set_property (GObject * object, guint prop_id,
     const GValue * value, GParamSpec * pspec)
 {
-  GstSpeexEnc *speexenc;
-
-  g_return_if_fail (GST_IS_SPEEXENC (object));
+  GstSpeexEnc *enc;
 
-  speexenc = GST_SPEEXENC (object);
+  enc = GST_SPEEX_ENC (object);
 
   switch (prop_id) {
-    case ARG_QUALITY:
-      speexenc->quality = g_value_get_float (value);
+    case PROP_QUALITY:
+      enc->quality = g_value_get_float (value);
       break;
-    case ARG_BITRATE:
-      speexenc->bitrate = g_value_get_int (value);
+    case PROP_BITRATE:
+      enc->bitrate = g_value_get_int (value);
       break;
-    case ARG_VBR:
-      speexenc->vbr = g_value_get_boolean (value);
+    case PROP_MODE:
+      enc->mode = g_value_get_enum (value);
       break;
-    case ARG_ABR:
-      speexenc->abr = g_value_get_int (value);
+    case PROP_VBR:
+      enc->vbr = g_value_get_boolean (value);
       break;
-    case ARG_VAD:
-      speexenc->vad = g_value_get_boolean (value);
+    case PROP_ABR:
+      enc->abr = g_value_get_int (value);
       break;
-    case ARG_DTX:
-      speexenc->dtx = g_value_get_boolean (value);
+    case PROP_VAD:
+      enc->vad = g_value_get_boolean (value);
       break;
-    case ARG_COMPLEXITY:
-      speexenc->complexity = g_value_get_int (value);
+    case PROP_DTX:
+      enc->dtx = g_value_get_boolean (value);
       break;
-    case ARG_NFRAMES:
-      speexenc->nframes = g_value_get_int (value);
+    case PROP_COMPLEXITY:
+      enc->complexity = g_value_get_int (value);
+      break;
+    case PROP_NFRAMES:
+      enc->nframes = g_value_get_int (value);
       break;
     default:
       G_OBJECT_WARN_INVALID_PROPERTY_ID (object, prop_id, pspec);
@@ -1119,18 +1210,23 @@ gst_speexenc_set_property (GObject * object, guint prop_id,
 }
 
 static GstStateChangeReturn
-gst_speexenc_change_state (GstElement * element, GstStateChange transition)
+gst_speex_enc_change_state (GstElement * element, GstStateChange transition)
 {
-  GstSpeexEnc *speexenc = GST_SPEEXENC (element);
+  GstSpeexEnc *enc = GST_SPEEX_ENC (element);
   GstStateChangeReturn res;
 
   switch (transition) {
     case GST_STATE_CHANGE_NULL_TO_READY:
-      speexenc->tags = gst_tag_list_new ();
+      enc->tags = gst_tag_list_new ();
       break;
     case GST_STATE_CHANGE_READY_TO_PAUSED:
-      speexenc->frameno = 0;
-      speexenc->samples_in = 0;
+      speex_bits_init (&enc->bits);
+      enc->frameno = 0;
+      enc->frameno_out = 0;
+      enc->samples_in = 0;
+      enc->start_ts = GST_CLOCK_TIME_NONE;
+      enc->next_ts = GST_CLOCK_TIME_NONE;
+      enc->granulepos_offset = 0;
       break;
     case GST_STATE_CHANGE_PAUSED_TO_PLAYING:
       /* fall through */
@@ -1139,17 +1235,24 @@ gst_speexenc_change_state (GstElement * element, GstStateChange transition)
   }
 
   res = GST_ELEMENT_CLASS (parent_class)->change_state (element, transition);
+  if (res == GST_STATE_CHANGE_FAILURE)
+    return res;
 
   switch (transition) {
     case GST_STATE_CHANGE_PLAYING_TO_PAUSED:
       break;
     case GST_STATE_CHANGE_PAUSED_TO_READY:
-      speexenc->setup = FALSE;
-      speexenc->header_sent = FALSE;
+      enc->setup = FALSE;
+      enc->header_sent = FALSE;
+      if (enc->state) {
+        speex_encoder_destroy (enc->state);
+        enc->state = NULL;
+      }
+      speex_bits_destroy (&enc->bits);
       break;
     case GST_STATE_CHANGE_READY_TO_NULL:
-      gst_tag_list_free (speexenc->tags);
-      speexenc->tags = NULL;
+      gst_tag_list_free (enc->tags);
+      enc->tags = NULL;
     default:
       break;
   }