DataUtil.java example

Explorer

SmartAndroidSource-master
- SmartAndroid
  - gen
    - com
      - smartandroid
        sa
        BuildConfig.java
        R.java
  - src
    - android
      - support
        v4
        app
        Watson.java
    - com
      - smartandroid
        sa
        XMainActivity.java
        activity
        SmartActivity.java
        SmartFragmentActivity.java
        animation
        Animator.java
        AnimatorInflater.java
        AnimatorListenerAdapter.java
        AnimatorProxy.java
        AnimatorSet.java
        ArgbEvaluator.java
        FloatEvaluator.java
        FloatKeyframeSet.java
        FloatProperty.java
        IntEvaluator.java
        IntKeyframeSet.java
        IntProperty.java
        Keyframe.java
        KeyframeSet.java
        NoSuchPropertyException.java
        ObjectAnimator.java
        PreHoneycombCompat.java
        Property.java
        PropertyValuesHolder.java
        ReflectiveProperty.java
        TimeAnimator.java
        TypeEvaluator.java
        ValueAnimator.java
        ViewHelper.java
        ViewPropertyAnimator.java
        ViewPropertyAnimatorHC.java
        ViewPropertyAnimatorICS.java
        ViewPropertyAnimatorPreHC.java
        appInfo
        AppInfo.java
        aq
        AQUtility.java
        AQuery.java
        AbstractAQuery.java
        AbstractAjaxCallback.java
        AccountHandle.java
        AjaxCallback.java
        AjaxStatus.java
        BasicHandle.java
        BitmapAjaxCallback.java
        BitmapCache.java
        Common.java
        Constants.java
        FacebookHandle.java
        GoogleHandle.java
        ImageOptions.java
        LocationAjaxCallback.java
        MarketService.java
        PredefinedBAOS.java
        Progress.java
        RatioDrawable.java
        Transformer.java
        WebDialog.java
        WebImage.java
        XmlDom.java
        avatars
        AvatarBorder.java
        AvatarDrawableFactory.java
        BorderedRoundedAvatarDrawable.java
        DoubleSquaredAvatarDrawable.java
        QuadrupleSquaredAvatarDrawable.java
        RoundedAvatarDrawable.java
        SquareCanvas.java
        SquareCanvasProvider.java
        SquareUtils.java
        SquaredAvatarDrawable.java
        TripleSquaredAvatarDrawable.java
        aysnc
        ASafeTask.java
        ArrayDequeCompat.java
        ArraysCompat.java
        AsyncTask.java
        CTask.java
        Log.java
        SCachedTask.java
        SSafeTask.java
        STask.java
        TaskExecutor.java
        bitmap
        BitmapInfo.java
        bv
        BelowView.java
        BottomView.java
        callback
        GlobalCallback.java
        core
        SmartCore.java
        cropper
        AspectRatioUtil.java
        CenterHandleHelper.java
        CornerHandleHelper.java
        CropImageView.java
        CropOverlayView.java
        Edge.java
        EdgePair.java
        Handle.java
        HandleHelper.java
        HandleUtil.java
        HorizontalHandleHelper.java
        ImageViewUtil.java
        PaintUtil.java
        VerticalHandleHelper.java
        drag
        DragGridView.java
        DragGridViewPager.java
        DragListView.java
        DragSortController.java
        DragSortCursorAdapter.java
        DragSortItemView.java
        DragSortItemViewCheckable.java
        OnRearrangeListener.java
        ResourceDragSortCursorAdapter.java
        SimpleDragSortCursorAdapter.java
        SimpleFloatViewManager.java
        entity
        MyPermission.java
        eventbus
        AsyncExecutor.java
        AsyncPoster.java
        BackgroundPoster.java
        ErrorDialogConfig.java
        ErrorDialogFragmentFactory.java
        ErrorDialogFragments.java
        ErrorDialogManager.java
        EventBus.java
        EventBusException.java
        ExceptionToResourceMapping.java
        HandlerPoster.java
        HasExecutionScope.java
        NoSubscriberEvent.java
        PendingPost.java
        PendingPostQueue.java
        SubscriberExceptionEvent.java
        SubscriberMethod.java
        SubscriberMethodFinder.java
        Subscription.java
        ThreadMode.java
        ThrowableFailureEvent.java
        fading
        FadingActionBarHelper.java
        FadingActionBarHelperBase.java
        ObservableScrollView.java
        ObservableScrollable.java
        ObservableWebViewWithHeader.java
        OnScrollChangedCallback.java
        RootLayout.java
        Utils.java
        floatextview
        Area.java
        ClickHandler.java
        CollisionHelper.java
        FlowTextView.java
        HtmlLink.java
        HtmlObject.java
        Line.java
        Obstacle.java
        OnLinkClickListener.java
        PaintHelper.java
        SpanParser.java
        json
        AnonymousAndLocalClassExclusionStrategy.java
        BaseMapTypeAdapter.java
        Cache.java
        CamelCaseSeparatorNamingPolicy.java
        CircularReferenceException.java
        CompositionFieldNamingPolicy.java
        DefaultConstructorAllocator.java
        DefaultTypeAdapters.java
        DelegatingJsonElementVisitor.java
        DisjunctionExclusionStrategy.java
        ExclusionStrategy.java
        ExposeAnnotationDeserializationExclusionStrategy.java
        ExposeAnnotationSerializationExclusionStrategy.java
        FieldAttributes.java
        FieldNamingPolicy.java
        FieldNamingStrategy.java
        FieldNamingStrategy2.java
        FieldNamingStrategy2Adapter.java
        Gson.java
        GsonBuilder.java
        GsonToMiniGsonTypeAdapter.java
        InnerClassExclusionStrategy.java
        InstanceCreator.java
        JavaFieldNamingPolicy.java
        JsonArray.java
        JsonArrayDeserializationVisitor.java
        JsonDeserializationContext.java
        JsonDeserializationVisitor.java
        JsonDeserializer.java
        JsonDeserializerExceptionWrapper.java
        JsonElement.java
        JsonElementVisitor.java
        JsonIOException.java
        JsonNull.java
        JsonObject.java
        JsonObjectDeserializationVisitor.java
        JsonParseException.java
        JsonParser.java
        JsonPrimitive.java
        JsonSerializationContext.java
        JsonSerializationVisitor.java
        JsonSerializer.java
        JsonStreamParser.java
        JsonSyntaxException.java
        JsonTreeNavigator.java
        LongSerializationPolicy.java
        LowerCamelCaseSeparatorNamingPolicy.java
        LowerCaseNamingPolicy.java
        LruCache.java
        MapAsArrayTypeAdapter.java
        MapTypeAdapter.java
        MappedObjectConstructor.java
        MemoryRefStack.java
        ModifierBasedExclusionStrategy.java
        ModifyFirstLetterNamingPolicy.java
        NullExclusionStrategy.java
        ObjectConstructor.java
        ObjectNavigator.java
        ObjectTypePair.java
        Pair.java
        ParameterizedTypeHandlerMap.java
        Primitives.java
        RecursiveFieldNamingPolicy.java
        ReflectingFieldNavigator.java
        SerializedNameAnnotationInterceptingNamingPolicy.java
        SyntheticFieldExclusionStrategy.java
        UpperCamelCaseSeparatorNamingPolicy.java
        UpperCaseNamingPolicy.java
        VersionConstants.java
        VersionExclusionStrategy.java
        annotations
        Expose.java
        SerializedName.java
        Since.java
        Until.java
        package-info.java
        internal
        $Gson$Preconditions.java
        $Gson$Types.java
        LazilyParsedNumber.java
        Streams.java
        UnsafeAllocator.java
        bind
        ArrayTypeAdapter.java
        CollectionTypeAdapter.java
        MiniGson.java
        Reflection.java
        ReflectiveTypeAdapter.java
        StringToValueMapTypeAdapter.java
        TypeAdapter.java
        TypeAdapterRuntimeTypeWrapper.java
        TypeAdapters.java
        package-info.java
        package-info.java
        reflect
        TypeToken.java
        package-info.java
        stream
        JsonReader.java
        JsonScope.java
        JsonToken.java
        JsonWriter.java
        MalformedJsonException.java
        StringPool.java
        loopj
        AsyncHttpClient.java
        AsyncHttpRequest.java
        AsyncHttpResponseHandler.java
        Base64.java
        Base64DataException.java
        Base64OutputStream.java
        BaseJsonHttpResponseHandler.java
        BinaryHttpResponseHandler.java
        DataAsyncHttpResponseHandler.java
        FileAsyncHttpResponseHandler.java
        JsonHttpResponseHandler.java
        JsonStreamerEntity.java
        MyRedirectHandler.java
        MySSLSocketFactory.java
        PersistentCookieStore.java
        PreemtiveAuthorizationHttpRequestInterceptor.java
        RangeFileAsyncHttpResponseHandler.java
        RequestHandle.java
        RequestParams.java
        ResponseHandlerInterface.java
        RetryHandler.java
        SaxAsyncHttpResponseHandler.java
        SerializableCookie.java
        SimpleMultipartEntity.java
        SyncHttpClient.java
        TextHttpResponseHandler.java
        package-info.java
        netWork
        NetWork.java
        otto
        AnnotatedHandlerFinder.java
        Bus.java
        DeadEvent.java
        EventHandler.java
        EventProducer.java
        HandlerFinder.java
        Produce.java
        Subscribe.java
        ThreadEnforcer.java
        pullto
        ILoadingLayout.java
        IPullToRefresh.java
        LoadingLayoutProxy.java
        OverscrollHelper.java
        PullToRefreshAdapterViewBase.java
        PullToRefreshBase.java
        PullToRefreshExpandableListView.java
        PullToRefreshGridView.java
        PullToRefreshHorizontalScrollView.java
        PullToRefreshListView.java
        PullToRefreshScrollView.java
        PullToRefreshWebView.java
        extras
        PullToRefreshWebView2.java
        SoundPullEventListener.java
        internal
        EmptyViewMethodAccessor.java
        FlipLoadingLayout.java
        IndicatorLayout.java
        LoadingLayout.java
        RotateLoadingLayout.java
        Utils.java
        ViewCompat.java
        pv
        Compat.java
        DefaultOnDoubleTapListener.java
        ISmartImageView.java
        SmartImageView.java
        SmartImageViewAttacher.java
        gestures
        CupcakeGestureDetector.java
        EclairGestureDetector.java
        FroyoGestureDetector.java
        GestureDetector.java
        OnGestureListener.java
        VersionedGestureDetector.java
        log
        LogManager.java
        Logger.java
        LoggerDefault.java
        scrollerproxy
        GingerScroller.java
        IcsScroller.java
        PreGingerScroller.java
        ScrollerProxy.java
        sherlock
        ActionBarSherlock.java
        app
        ActionBar.java
        SherlockActivity.java
        SherlockDialogFragment.java
        SherlockExpandableListActivity.java
        SherlockFragment.java
        SherlockFragmentActivity.java
        SherlockListActivity.java
        SherlockListFragment.java
        SherlockPreferenceActivity.java
        internal
        ActionBarSherlockCompat.java
        ActionBarSherlockNative.java
        ResourcesCompat.java
        app
        ActionBarImpl.java
        ActionBarWrapper.java
        nineoldandroids
        view
        NineViewGroup.java
        widget
        NineFrameLayout.java
        NineHorizontalScrollView.java
        NineLinearLayout.java
        view
        ActionProviderWrapper.java
        StandaloneActionMode.java
        View_HasStateListenerSupport.java
        View_OnAttachStateChangeListener.java
        menu
        ActionMenu.java
        ActionMenuItem.java
        ActionMenuItemView.java
        ActionMenuPresenter.java
        ActionMenuView.java
        BaseMenuPresenter.java
        ListMenuItemView.java
        MenuBuilder.java
        MenuItemImpl.java
        MenuItemWrapper.java
        MenuPopupHelper.java
        MenuPresenter.java
        MenuView.java
        MenuWrapper.java
        SubMenuBuilder.java
        SubMenuWrapper.java
        widget
        AbsActionBarView.java
        ActionBarContainer.java
        ActionBarContextView.java
        ActionBarView.java
        CapitalizingButton.java
        CapitalizingTextView.java
        CollapsibleActionViewWrapper.java
        IcsAbsSpinner.java
        IcsAdapterView.java
        IcsColorDrawable.java
        IcsLinearLayout.java
        IcsListPopupWindow.java
        IcsProgressBar.java
        IcsSpinner.java
        IcsToast.java
        IcsView.java
        PopupWindowCompat.java
        ScrollingTabContainerView.java
        TabsLinearLayout.java
        view
        ActionMode.java
        ActionProvider.java
        CollapsibleActionView.java
        Menu.java
        MenuInflater.java
        MenuItem.java
        SubMenu.java
        Window.java
        widget
        ActivityChooserModel.java
        ActivityChooserView.java
        SearchView.java
        ShareActionProvider.java
        SuggestionsAdapter.java
        slideMenu
        CanvasTransformerBuilder.java
        CustomViewAbove.java
        CustomViewBehind.java
        MenuInterface.java
        SlidingActivity.java
        SlidingActivityBase.java
        SlidingActivityHelper.java
        SlidingFragmentActivity.java
        SlidingListActivity.java
        SlidingMenu.java
        SlidingPreferenceActivity.java
        sql
        ActiveAndroid.java
        Cache.java
        Configuration.java
        DatabaseHelper.java
        Model.java
        ModelInfo.java
        TableInfo.java
        annotation
        Column.java
        Table.java
        app
        Application.java
        content
        ContentProvider.java
        query
        Delete.java
        From.java
        Join.java
        Select.java
        Set.java
        Sqlable.java
        Update.java
        serializer
        BigDecimalSerializer.java
        CalendarSerializer.java
        FileSerializer.java
        SqlDateSerializer.java
        TypeSerializer.java
        UUIDSerializer.java
        UtilDateSerializer.java
        util
        IOUtils.java
        Log.java
        NaturalOrderComparator.java
        ReflectionUtils.java
        SQLiteUtils.java
        SqlParser.java
        Tokenizer.java
        widget
        ModelAdapter.java
        stagger
        ClassLoaderSavedState.java
        DynamicHeightImageView.java
        DynamicHeightTextView.java
        ExtendableListView.java
        HeaderViewListAdapter.java
        StaggeredGridView.java
        system
        SystemInfo.java
        tag
        Connection.java
        HttpStatusException.java
        SmartTag.java
        UnsupportedMimeTypeException.java
        examples
        HtmlToPlainText.java
        ListLinks.java
        package-info.java
        helper
        DataUtil.java
        DescendableLinkedList.java
        HttpConnection.java
        StringUtil.java
        Validate.java
        nodes
        Attribute.java
        Attributes.java
        Comment.java
        DataNode.java
        Document.java
        DocumentType.java
        Element.java
        Entities.java
        FormElement.java
        Node.java
        TextNode.java
        XmlDeclaration.java
        package-info.java
        package-info.java
        parser
        CharacterReader.java
        HtmlTreeBuilder.java
        HtmlTreeBuilderState.java
        ParseError.java
        ParseErrorList.java
        Parser.java
        Tag.java
        Token.java
        TokenQueue.java
        Tokeniser.java
        TokeniserState.java
        TreeBuilder.java
        XmlTreeBuilder.java
        package-info.java
        safety
        Cleaner.java
        Whitelist.java
        package-info.java
        select
        Collector.java
        CombiningEvaluator.java
        Elements.java
        Evaluator.java
        NodeTraversor.java
        NodeVisitor.java
        QueryParser.java
        Selector.java
        StructuralEvaluator.java
        package-info.java
        tools
        AssistTool.java
        topbar
        ActionBar.java
        ScrollingTextView.java
        TopBar.java
        verifi
        AbstractVerifi.java
        AbstractVerifior.java
        AlnumVerifior.java
        ConfirmVerifi.java
        EmailVerifior.java
        Form.java
        HexVerifior.java
        NotEmptyVerifior.java
        OkCancelBar.java
        OrTwoRequiredVerifi.java
        PhoneVerifior.java
        RegExpVerifior.java
        UrlVerifior.java
        Verifi.java
        VerifiorException.java
        view
        AutoLoading.java
        AutoReFreshListView.java
        AutoViewHelper.java
        BSRProgressBar.java
        BSRQXInterpolator.java
        CircleButton.java
        DarkImageButton.java
        PLScollListView.java
        PopoverView.java
        PullScrollView.java
        ReScrollView.java
        SRefreshLayout.java
        SmartDialog.java
        SmartGridView.java
        SmartListView.java
        SmartingScrollView.java
        StaggeredGridView.java
        VPScrollView.java
        WeiboView.java
        WheelMenu.java
        vl
        AuthFailureError.java
        Cache.java
        CacheDispatcher.java
        DefaultRetryPolicy.java
        ExecutorDelivery.java
        Network.java
        NetworkDispatcher.java
        NetworkError.java
        NetworkResponse.java
        NoConnectionError.java
        ParseError.java
        Request.java
        RequestQueue.java
        Response.java
        ResponseDelivery.java
        RetryPolicy.java
        ServerError.java
        TimeoutError.java
        VolleyError.java
        VolleyLog.java
        toolbox
        AndroidAuthenticator.java
        Authenticator.java
        BasicNetwork.java
        ByteArrayPool.java
        ClearCacheRequest.java
        DiskBasedCache.java
        HttpClientStack.java
        HttpHeaderParser.java
        HttpStack.java
        HurlStack.java
        ImageLoader.java
        ImageRequest.java
        JsonArrayRequest.java
        JsonObjectRequest.java
        JsonRequest.java
        NetworkImageView.java
        NoCache.java
        PoolingByteArrayOutputStream.java
        RequestFuture.java
        StringRequest.java
        Volley.java
        vpic
        CirclePageIndicator.java
        IconPageIndicator.java
        IconPagerAdapter.java
        IcsLinearLayout.java
        LinePageIndicator.java
        PageIndicator.java
        TabPageIndicator.java
        TitlePageIndicator.java
        UnderlinePageIndicator.java
        zUImageLoader
        cache
        disc
        DiscCacheAware.java
        DiskCache.java
        impl
        BaseDiscCache.java
        LimitedAgeDiscCache.java
        UnlimitedDiscCache.java
        ext
        DiskLruCache.java
        LruDiscCache.java
        StrictLineReader.java
        Util.java
        naming
        FileNameGenerator.java
        HashCodeFileNameGenerator.java
        Md5FileNameGenerator.java
        memory
        BaseMemoryCache.java
        LimitedMemoryCache.java
        MemoryCache.java
        MemoryCacheAware.java
        impl
        FIFOLimitedMemoryCache.java
        FuzzyKeyMemoryCache.java
        LRULimitedMemoryCache.java
        LargestLimitedMemoryCache.java
        LimitedAgeMemoryCache.java
        LruMemoryCache.java
        UsingFreqLimitedMemoryCache.java
        WeakMemoryCache.java
        core
        DefaultConfigurationFactory.java
        DisplayBitmapTask.java
        DisplayImageOptions.java
        ImageLoader.java
        ImageLoaderConfiguration.java
        ImageLoaderEngine.java
        ImageLoadingInfo.java
        LoadAndDisplayImageTask.java
        ProcessAndDisplayImageTask.java
        assist
        ContentLengthInputStream.java
        FailReason.java
        FlushedInputStream.java
        ImageScaleType.java
        ImageSize.java
        LoadedFrom.java
        QueueProcessingType.java
        ViewScaleType.java
        deque
        BlockingDeque.java
        Deque.java
        LIFOLinkedBlockingDeque.java
        LinkedBlockingDeque.java
        decode
        BaseImageDecoder.java
        ImageDecoder.java
        ImageDecodingInfo.java
        display
        BitmapDisplayer.java
        FadeInBitmapDisplayer.java
        RoundedBitmapDisplayer.java
        RoundedVignetteBitmapDisplayer.java
        SimpleBitmapDisplayer.java
        download
        BaseImageDownloader.java
        ImageDownloader.java
        imageaware
        ImageAware.java
        ImageViewAware.java
        NonViewAware.java
        ViewAware.java
        listener
        ImageLoadingListener.java
        ImageLoadingProgressListener.java
        PauseOnScrollListener.java
        SimpleImageLoadingListener.java
        process
        BitmapProcessor.java
        utils
        DiskCacheUtils.java
        ImageSizeUtils.java
        IoUtils.java
        L.java
        MemoryCacheUtils.java
        StorageUtils.java
        zip
        ByteSource.java
        FileSource.java
        IdentityNameMapper.java
        NameMapper.java
        ZTFileUtil.java
        ZipBreakException.java
        ZipEntryCallback.java
        ZipEntryOrInfoAdapter.java
        ZipEntrySource.java
        ZipEntryUtil.java
        ZipException.java
        ZipExceptionUtil.java
        ZipFileUtil.java
        ZipInfoCallback.java
        ZipUtil.java
        Zips.java
        commons
        FileUtils.java
        FilenameUtils.java
        IOUtils.java
        transform
        ByteArrayZipEntryTransformer.java
        FileZipEntryTransformer.java
        StreamZipEntryTransformer.java
        StringZipEntryTransformer.java
        ZipEntrySourceZipEntryTransformer.java
        ZipEntryTransformer.java
        ZipEntryTransformerEntry.java
        zmImageview
        Animation.java
        Animator.java
        FlingAnimation.java
        FlingAnimationListener.java
        FlingListener.java
        GestureImageViewListener.java
        GestureImageViewTouchListener.java
        MathUtils.java
        MoveAnimation.java
        MoveAnimationListener.java
        VectorF.java
        ZoomAnimation.java
        ZoomAnimationListener.java
        ZoomImageView.java

package com.smartandroid.sa.tag.helper;

import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;
import java.io.RandomAccessFile;
import java.nio.ByteBuffer;
import java.nio.charset.Charset;
import java.nio.charset.IllegalCharsetNameException;
import java.util.Locale;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import com.smartandroid.sa.tag.nodes.Document;
import com.smartandroid.sa.tag.nodes.Element;
import com.smartandroid.sa.tag.parser.Parser;

/**
 * Internal static utilities for handling data.
 * 
 */
public class DataUtil {
	private static final Pattern charsetPattern = Pattern
			.compile("(?i)\\bcharset=\\s*(?:\"|')?([^\\s,;\"']*)");
	static final String defaultCharset = "UTF-8"; // used if not found in header
													// or meta charset
	private static final int bufferSize = 0x20000; // ~130K.

	private DataUtil() {
	}

	/**
	 * Loads a file to a Document.
	 * 
	 * @param in
	 *            file to load
	 * @param charsetName
	 *            character set of input
	 * @param baseUri
	 *            base URI of document, to resolve relative links against
	 * @return Document
	 * @throws IOException
	 *             on IO error
	 */
	public static Document load(File in, String charsetName, String baseUri)
			throws IOException {
		ByteBuffer byteData = readFileToByteBuffer(in);
		return parseByteData(byteData, charsetName, baseUri,
				Parser.htmlParser());
	}

	/**
	 * Parses a Document from an input steam.
	 * 
	 * @param in
	 *            input stream to parse. You will need to close it.
	 * @param charsetName
	 *            character set of input
	 * @param baseUri
	 *            base URI of document, to resolve relative links against
	 * @return Document
	 * @throws IOException
	 *             on IO error
	 */
	public static Document load(InputStream in, String charsetName,
			String baseUri) throws IOException {
		ByteBuffer byteData = readToByteBuffer(in);
		return parseByteData(byteData, charsetName, baseUri,
				Parser.htmlParser());
	}

	/**
	 * Parses a Document from an input steam, using the provided Parser.
	 * 
	 * @param in
	 *            input stream to parse. You will need to close it.
	 * @param charsetName
	 *            character set of input
	 * @param baseUri
	 *            base URI of document, to resolve relative links against
	 * @param parser
	 *            alternate {@link Parser#xmlParser() parser} to use.
	 * @return Document
	 * @throws IOException
	 *             on IO error
	 */
	public static Document load(InputStream in, String charsetName,
			String baseUri, Parser parser) throws IOException {
		ByteBuffer byteData = readToByteBuffer(in);
		return parseByteData(byteData, charsetName, baseUri, parser);
	}

	// reads bytes first into a buffer, then decodes with the appropriate
	// charset. done this way to support
	// switching the chartset midstream when a meta http-equiv tag defines the
	// charset.
	// todo - this is getting gnarly. needs a rewrite.
	static Document parseByteData(ByteBuffer byteData, String charsetName,
			String baseUri, Parser parser) {
		String docData;
		Document doc = null;
		if (charsetName == null) { // determine from meta. safe parse as UTF-8
			// look for <meta http-equiv="Content-Type"
			// content="text/html;charset=gb2312"> or HTML5 <meta
			// charset="gb2312">
			docData = Charset.forName(defaultCharset).decode(byteData)
					.toString();
			doc = parser.parseInput(docData, baseUri);
			Element meta = doc.select(
					"meta[http-equiv=content-type], meta[charset]").first();
			if (meta != null) { // if not found, will keep utf-8 as best attempt
				String foundCharset;
				if (meta.hasAttr("http-equiv")) {
					foundCharset = getCharsetFromContentType(meta
							.attr("content"));
					if (foundCharset == null && meta.hasAttr("charset")) {
						try {
							if (Charset.isSupported(meta.attr("charset"))) {
								foundCharset = meta.attr("charset");
							}
						} catch (IllegalCharsetNameException e) {
							foundCharset = null;
						}
					}
				} else {
					foundCharset = meta.attr("charset");
				}

				if (foundCharset != null && foundCharset.length() != 0
						&& !foundCharset.equals(defaultCharset)) { // need to
																	// re-decode
					foundCharset = foundCharset.trim().replaceAll("[\"']", "");
					charsetName = foundCharset;
					byteData.rewind();
					docData = Charset.forName(foundCharset).decode(byteData)
							.toString();
					doc = null;
				}
			}
		} else { // specified by content type header (or by user on file load)
			Validate.notEmpty(
					charsetName,
					"Must set charset arg to character set of file to parse. Set to null to attempt to detect from HTML");
			docData = Charset.forName(charsetName).decode(byteData).toString();
		}
		// UTF-8 BOM indicator. takes precedence over everything else. rarely
		// used. re-decodes incase above decoded incorrectly
		if (docData.length() > 0 && docData.charAt(0) == 65279) {
			byteData.rewind();
			docData = Charset.forName(defaultCharset).decode(byteData)
					.toString();
			docData = docData.substring(1);
			charsetName = defaultCharset;
			doc = null;
		}
		if (doc == null) {
			doc = parser.parseInput(docData, baseUri);
			doc.outputSettings().charset(charsetName);
		}
		return doc;
	}

	/**
	 * Read the input stream into a byte buffer.
	 * 
	 * @param inStream
	 *            the input stream to read from
	 * @param maxSize
	 *            the maximum size in bytes to read from the stream. Set to 0 to
	 *            be unlimited.
	 * @return the filled byte buffer
	 * @throws IOException
	 *             if an exception occurs whilst reading from the input stream.
	 */
	static ByteBuffer readToByteBuffer(InputStream inStream, int maxSize)
			throws IOException {
		Validate.isTrue(maxSize >= 0, "maxSize must be 0 (unlimited) or larger");
		final boolean capped = maxSize > 0;
		byte[] buffer = new byte[bufferSize];
		ByteArrayOutputStream outStream = new ByteArrayOutputStream(bufferSize);
		int read;
		int remaining = maxSize;

		while (true) {
			read = inStream.read(buffer);
			if (read == -1)
				break;
			if (capped) {
				if (read > remaining) {
					outStream.write(buffer, 0, remaining);
					break;
				}
				remaining -= read;
			}
			outStream.write(buffer, 0, read);
		}
		ByteBuffer byteData = ByteBuffer.wrap(outStream.toByteArray());
		return byteData;
	}

	static ByteBuffer readToByteBuffer(InputStream inStream) throws IOException {
		return readToByteBuffer(inStream, 0);
	}

	static ByteBuffer readFileToByteBuffer(File file) throws IOException {
		RandomAccessFile randomAccessFile = null;
		try {
			randomAccessFile = new RandomAccessFile(file, "r");
			byte[] bytes = new byte[(int) randomAccessFile.length()];
			randomAccessFile.readFully(bytes);
			return ByteBuffer.wrap(bytes);
		} finally {
			if (randomAccessFile != null)
				randomAccessFile.close();
		}
	}

	/**
	 * Parse out a charset from a content type header. If the charset is not
	 * supported, returns null (so the default will kick in.)
	 * 
	 * @param contentType
	 *            e.g. "text/html; charset=EUC-JP"
	 * @return "EUC-JP", or null if not found. Charset is trimmed and
	 *         uppercased.
	 */
	static String getCharsetFromContentType(String contentType) {
		if (contentType == null)
			return null;
		Matcher m = charsetPattern.matcher(contentType);
		if (m.find()) {
			String charset = m.group(1).trim();
			charset = charset.replace("charset=", "");
			if (charset.isEmpty())
				return null;
			try {
				if (Charset.isSupported(charset))
					return charset;
				charset = charset.toUpperCase(Locale.ENGLISH);
				if (Charset.isSupported(charset))
					return charset;
			} catch (IllegalCharsetNameException e) {
				// if our advanced charset matching fails.... we just take the
				// default
				return null;
			}
		}
		return null;
	}

}