Отчёт об организационно-экономической практике "ГПИ"
разработчиков использовать специализированные средства разработки, ConText поддерживает стандартный SQL, что позволяет использовать стандартные приемы при проектировании ИС. Разработчики, создавая ИС, могут работать с любыми средствами разработки, “понимающими” SQL, такими как PowerBuilder, SQL*Windows, Visual Basic и т.д.
Мощный язык запросов
Для организации контекстного поиска в OCC используется инвертированный индекс - каждому слову ставятся в соответствие номера документов, в которых это слово содержится. Дополнительно OCC хранит информацию о положении слова в документе. Это позволяет организовать поиск по фразе или выражению, а также поиск по “близости” слов в тексте.
OCC позволяет реализовать
· Точный поиск по слову/фразе
· Поиск по шаблону
· Поиск с учетом “весов”
· Поиск с учетом “близости”
· Поддержка тезаурусов
· Ранжирование документов по релевантности
· Нечеткий поиск
· Булева логика
· Стоп лист
Минусы
OCC поддерживает любой 8 битный character set, и формально позволяет работать с текстами в любых кодировках, поддерживаемых СУБД Oracle, но при этом, не обеспечивает функциональные возможности, доступные для англоязычных текстов. Частично эти возможности реализованы для французского, немецкого, итальянского, испанского и датского языков. В частности, для русскоязычных текстов не поддерживаются следующие возможности OCC:
· Stemming расширение запроса всеми возможными словоформами
· fuzzy matching расширение запроса словами похожими по написанию, что позволяет уменьшить вероятность ошибок, возникающих при ошибках сканирования
· Soundex расширение индекса словами созвучными с встречаемыми в индексируемом тексте.
Это связано с зависимостью реализации этих возможностей от морфологии, лексики, семантики и фонетики языка.
Помимо отсутствия поддержки стандартных возможностей OCC, при работе с русскими текстами возникает ряд проблем связанных с существенными различиями в структуре русского и английского языков.
Суммируя, перечислим основные сложности, с которыми встречается пользователь OCC при работе с русскими текстами:
1. Большой размер индексов, создаваемых OCC эта проблема становится очень существенной для средних и больших баз данных.
2. Невозможность поиска документов, содержащих все словоформы слова, заданного в запросе. Например, для поиска документов, содержащих слово “президент”, необходимо либо перечислить все возможные словоформы в запросе, либо использовать шаблон для поиска - “президент%”. В последнем случае будут найдены документы, содержащие “президент” + словоформы, “президентский” + словоформы и т.д., то есть существенно больше документов, чем требовалось.
3. Невысокая производительность обработки запросов вызвано большим размером индекса, и необходимостью расширять запрос шаблоном.
4. Невозможность создавать тезаурус
Что такое RCO
RCO позволяет полностью преодолеть вышеперечисленные сложности работы с OCC. Это решение основано на открытых стандартах и спецификациях Oracle и не ограничивает возможности OCC.
Основные характеристики RCO:
1. Размер индекса сокращается в 5-10 раз и составляет 10 20 процентов от объема индексируемого текста.
2. Поиск документов происходит с учетом всех словоформ, при этом в запросе слова для поиска могут встречаться в любой морфологической форме.
3. Предоставляется возможность исключать части речи, не используемые в запросах (наречия, местоимения, предлоги) из индекса.
4. Предоставляется возможность создания тезауруса.
5. Настройки RCO не влияют на настройки OCC, что позволяет работать с базами данных, содержащими одновременно тексты на поддерживаемых OCC языках и русском.
6. Предлагаются специальные настройки для документов в формате HTML при создании индекса.
7. RCO поддерживает обработку словарных конструкций, состоящих из цифр, русских и латинских букв.
8. Поддерживаются все кодовые страницы русского языка.
9. Поддерживаются документы в большинстве двоичных форматов.
10. Скорость поиска увеличивается в 3-5 раз.
Совместимость с программными продуктами Oracle.
RCO основан на открытых стандартах и спецификациях Oracle. Взаимодействие компонентов RCO и продуктов Oracle происходит:
· посредством интерфейса, предоставляемого Oracle PL/SQL pipes RCO pipes dispatcher, RCO listener
· используя стандарты, предусматриваемые CONTEXT CARTRIDGE для внешних фильтров. RCO filter
· с помощью интерфейса OCI RCO listener
Вышеперечисленные интерфейсы стандартные и поддерживаются Oracle. В RCO предусмотрена возможность интеграции с существующими приложениями, использующими OCC, что позволяет существенно улучшить их быстродействие и расширить функциональные возможности.
Дизайн
Хороший дизайн является важным аспектом разработки любой Интернет-системы. Профессиональный дизайн является обязательным условием для создания успешного проекта.
«Гарант-Парк-Интернет» предлагает инновационный дизайн, отвечающий требованиям быстро эволюционирующей индустрии. Интеграция с передовыми программными решениями позволяет эффективно комбинировать содержание, дизайн и функциональность проекта. В работе используются самые свежие технологии и самые лучшие инструменты.
Спектр услуг включает:
· Графический дизайн.
· Разработка фирменного стиля и (или) адаптация существующего для использования в Сети.
· Создание эксклюзивных иллюстраций, пиктограмм, фирменных персонажей и многого другого, что сделает ваш сайт прекрасным и удивительным.
· Разработка элементов мультимедиа (Flash-анимация, DHTML, видео, аудио).
Интернет-консалтинг
Общеизвестно, что в области электронного бизнеса только обширные знания и практический опыт могут обеспечить точность производимой оценки, эффективность и успешность предлагаемых рекомендаций и бизнес решений. Для помощи в обеспечении партнеров основополагающей информацией для принятия решения о сотрудничестве, а также для облегчения совместного использования знаний и опыта компания «Гарант-Парк-Интернет» представляет предлагаемые услуги через три основных направления комплексных Интернет решений:
· имидж
· бизнес
· сообщество
Предлагая доступные и исчерпывающие консультации по структуре рынков основных направлений электронного бизнеса и тенденциям их изменения, компания преданна идее обеспечения своих партнеров конкурентными преимуществами в указанных областях.
Темп изменений, который мы видим на рынке, беспрецедентен. Идея относительно электронного бизнеса как отдельной и отличной от других альтернативы развития потерпела крах. Сейчас игроки или находят способы делать Интернет центром их стратегического бизнес планирования или рискуют потерять актуальность в сегодняшней конкурентной среде. В отличие от стратегий многих консультирующих фирм компания сосредотачивается только на Интернет и его использовании для создания имиджа, бизнеса, сообщества и удовлетворения конечных пользователей. В результате, компания способна быстро идентифицировать и интерпретировать проблемы, стоящие перед клиентом,
скачать реферат
первая ... 2 3 4 5 6 7 8 ... последняя