Iterators

What are Iterators?

Iterators in Pixeltable are specialized tools for processing and transforming media content. They efficiently break down large files into manageable chunks, enabling analysis at different granularities. Iterators work seamlessly with views to create virtual derived tables without duplicating storage. In Pixeltable, iterators:

Process media files incrementally to manage memory efficiently
Transform single records into multiple output records
Support various media types including documents, videos, images, and audio
Integrate with the view system for automated processing pipelines
Provide configurable parameters for fine-tuning output

Iterators are particularly useful when:

Working with large media files that can’t be processed at once
Building retrieval systems that require chunked content
Creating analysis pipelines for multimedia data
Implementing feature extraction workflows

import pixeltable as pxt
from pixeltable.iterators import DocumentSplitter

# Create a view using an iterator
chunks = pxt.create_view(
    'docs.chunks',
    documents_table,
    iterator=DocumentSplitter.create(
        document=documents_table.document,
        separators='paragraph'
    )
)

Core Concepts

Document Splitting

Split documents into chunks by headings, paragraphs, or sentences

Video Processing

Extract frames at specified intervals or counts

Image Tiling

Divide images into overlapping or non-overlapping tiles

Audio Chunking

Split audio files into time-based chunks with configurable overlap

Iterators are powerful tools for processing large media files. They work seamlessly with Pixeltable’s computed columns and versioning system.

Available Iterators

from pixeltable.iterators import DocumentSplitter

# Create view with document chunks
chunks_view = pxt.create_view(
    'docs.chunks',
    docs_table,
    iterator=DocumentSplitter.create(
        document=docs_table.document,
        separators='paragraph,token_limit',
        limit=500,
        metadata='title,heading'
    )
)

Parameters

separators: Choose from ‘heading’, ‘paragraph’, ‘sentence’, ‘token_limit’, ‘char_limit’, ‘page’
limit: Maximum tokens/characters per chunk
metadata: Optional fields like ‘title’, ‘heading’, ‘sourceline’, ‘page’, ‘bounding_box’
overlap: Optional overlap between chunks

Common Use Cases

Document Processing

Split documents for:

RAG systems
Text analysis
Content extraction

Video Analysis

Extract frames for:

Object detection
Scene classification
Activity recognition

Image Processing

Create tiles for:

High-resolution analysis
Object detection
Segmentation tasks

Audio Analysis

Split audio for:

Speech recognition
Sound classification
Audio feature extraction

Example Workflows

RAG Pipeline

# Create document chunks
chunks = pxt.create_view(
    'rag.chunks',
    docs_table,
    iterator=DocumentSplitter.create(
        document=docs_table.document,
        separators='paragraph',
        limit=500
    )
)

# Add embeddings
chunks.add_embedding_index(
    'text',
    string_embed=sentence_transformer.using(
        model_id='all-mpnet-base-v2'
    )
)

Video Object Detection

# Extract frames at 1 FPS
frames = pxt.create_view(
    'detection.frames',
    videos_table,
    iterator=FrameIterator.create(
        video=videos_table.video,
        fps=1.0
    )
)

# Add object detection
frames.add_computed_column(detections=detect_objects(frames.frame))

Audio Transcription

# Split long audio files
chunks = pxt.create_view(
    'audio.chunks',
    audio_table,
    iterator=AudioSplitter.create(
        audio=audio_table.audio,
        chunk_duration_sec=30.0
    )
)

# Add transcription
chunks.add_computed_column(text=whisper_transcribe(chunks.audio_chunk))

Video Generation

from pixeltable.functions.video import make_video

# Extract frames at 1 FPS
frames = pxt.create_view(
    'video.frames',
    videos_table,
    iterator=FrameIterator.create(
        video=videos_table.video,
        fps=1.0
    )
)

# Process frames (e.g., apply a filter)
frames.add_computed_column(processed=frames.frame.filter('BLUR'))

# Create new videos from processed frames
processed_videos = frames.select(
    frames.video_id,
    make_video(frames.pos, frames.processed)  # Default fps is 25
).group_by(frames.video_id).collect()

Best Practices

Memory Management

Use appropriate chunk sizes
Consider overlap requirements
Monitor memory usage with large files

Performance

Balance chunk size vs. processing time
Use batch processing when possible
Cache intermediate results

Tips & Tricks

When using token_limit with DocumentSplitter, ensure the limit accounts for any model context windows in your pipeline.

Additional Resources

API Reference

Complete iterator documentation

Examples

Sample applications

Tutorials

Step-by-step guides

Welcome to Pixeltable

Multimodal AI Datastore

Tutorials

Libraries

What are Iterators?

Core Concepts

Document Splitting

Video Processing

Image Tiling

Audio Chunking

Available Iterators

Parameters

Common Use Cases

Document Processing

Video Analysis

Image Processing

Audio Analysis

Example Workflows

Best Practices

Memory Management

Performance

Tips & Tricks

Additional Resources

API Reference

Examples

Tutorials

Welcome to Pixeltable

Multimodal AI Datastore

Tutorials

Libraries

​What are Iterators?

​Core Concepts

Document Splitting

Video Processing

Image Tiling

Audio Chunking

​Available Iterators

​Parameters

​Common Use Cases

Document Processing

Video Analysis

Image Processing

Audio Analysis

​Example Workflows

​Best Practices

Memory Management

Performance

​Tips & Tricks

​Additional Resources

API Reference

Examples

Tutorials

What are Iterators?

Core Concepts

Available Iterators

Parameters

Common Use Cases

Example Workflows

Best Practices

Tips & Tricks

Additional Resources